Université Lyon 1
Arqus
Accueil  >>  Analyse des données multi-dimensionnelles
  • Unité d'enseignement : Analyse des données multi-dimensionnelles
Nombre de crédits de l'UE : 2
Code APOGEE : PL8022IF
    Responsabilité de l'UE :
BENABDESLEM KHALID
 khalid.benabdeslemuniv-lyon1.fr
04.72.43.19.97
    Type d'enseignement
Nb heures *
Cours Magistraux (CM)
15 h
Travaux Dirigés (TD)
0 h
Travaux Pratiques (TP)
12 h
Durée de projet en autonomie (PRJ)
h
Durée du stage
h
Effectif Cours magistraux (CM)
0 étudiants
Effectif Travaux dirigés (TD)
0 étudiants
Effectif Travaux pratiques (TP)
0 étudiants
Activité tuteurée personnelle (étudiant)
15 h
Activité tuteurée encadrée (enseignant)
3 h
Heures de Tutorat étudiant
0 h

* Ces horaires sont donnés à titre indicatif.

    Pré-requis :
Statistiques descriptives, Programmation Python, SAS
    Compétences attestées (transversales, spécifiques) :
Acquérir les fondements de base d'un data scientist
    Programme de l'UE / Thématiques abordées :

L'objectif de cette UE est de préparer les étudiants au décisionnel avec des méthodes statistiques descriptives et exploratoires. Il s'agit de méthodes qui permettent d'avoir un premier pas dans l'extraction de connaissances à partir de données, pouvoir les visualiser et d'en extraire le maximum d'informations pertinentes pouvant amener à des processus d'aide à la décision. Le programme de cette UE est organisé sous forme d'un "Pipe-line" qui commence à partir de l'exploration des données multidimensionnelles (quantitatives et qualitatives) jusqu'à l'extraction de connaissances à l'aide de méthodes de réduction de dimension, d'extraction de variables, de visualisation et classification automatique des données.

Le programme débutera par des notions générales sur des connaissances élémentaires qu’on peut extraire à partir des bases de données statistiques. Il s’agit de : la moyenne, l’écart type, la covariance et la corrélation entre variables. Ensuite, les étudiants verront comment préparer le terrain pour des processus d’aide à la décision par des techniques de codage et de prétraitement. Une étape nécessaire par la suite concernera la visualisation des données multidimensionnelles sur des plans bidimensionnels. C’est dans cette étape que les étudiants feront la connaissance de méthodes statistiques de réduction de dimension et de transformation de variables basée sur l’analyse factorielle. En effet, les données peuvent être de nature quantitative, il s’agira donc d’étudier l’analyse en composantes principales (ACP) ou qualitatives où les méthodes d’analyse factorielle des correspondance seront abordées (AFC, ACM).

Une question primordiale se pose à se niveau : après la représentation de la distribution des données sur un plan, comment peut-on extraire des profils pertinents à partir de ces données. La question sera traitée par des méthodes de classification automatique par partitionnement (K-Means, Centre mobiles, ..) et par hiérarchisation (CAH, LBG, …).

Finalement, les étudiants verront comment interpréter les profils extraits par des méthodes à base de tests statistiques.
    Parcours / Spécialité / Filière / Option utilisant cette UE :
Date de la dernière mise-à-jour : 12/01/2024
SELECT MEN_ID, `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`, `PAR_ID` FROM parcours INNER JOIN ue_parcours ON PAR_ID_FK=PAR_ID INNER JOIN mention ON MEN_ID = PAR_MENTION_FK WHERE PAR_ACTIVATE = 0 AND UE_ID_FK='18554' ORDER BY `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`