Université Lyon 1
Arqus
Accueil  >>  Analyse de données et classification
  • Unité d'enseignement : Analyse de données et classification
Nombre de crédits de l'UE : 3
Code APOGEE : PL6018MM
    Responsabilité de l'UE :
MARTEAU CLEMENT
 clement.marteauuniv-lyon1.fr
    Type d'enseignement
Nb heures *
Cours Magistraux (CM)
21 h
Travaux Pratiques (TP)
18 h
Durée de projet en autonomie (PRJ)
6 h
Activité tuteurée personnelle (étudiant)
12 h
Activité tuteurée encadrée (enseignant)
6 h
Heures de Tutorat étudiant
0 h

* Ces horaires sont donnés à titre indicatif.

    Pré-requis :
Cursus Mathématiques appliquées niveau L2 validé et acquis d'enseignements du S5 en SAS, R et Python en particulier.
    Compétences attestées (transversales, spécifiques) :

Savoir représenter des données multivariées et associer des indicateurs statistiques pertinent.

Savoir mettre en œuvre et interpréter une Analyse en Composantes principales

Comprendre et être capable de déployer l'agorithme des K-means

Savoir modéliser un problème de clustering à l'aide d'un modèle de mélange et être capable de construire l'algorithme EM associé.

Savoir mettre en œuvre ces méthodes à l'aide de différentes interfaces informatiques.

 

Compétences transverses: optimisation convexe sous contrainte, programmation.
    Programme de l'UE / Thématiques abordées :

Passage en revue des méthodes les plus couramment utilisées en analyse de données, et approfondissement. En particulier, les problématiques de fouille de données, réduction de dimension et clustering sont successivement abordées.

 

Fouille de données et réduction de dimension: représentation de différents types de données (variables numériques, catégorielles, etc...), indicateurs statistiques usuels. Analyse en composantes principales (ACP): Inerties globales et axiales, construction des axes principaux, interprétation des composantes principales et choix du nombre de composantes. Focus éventuel sur des variantes de l'ACP.

 

Classification non-supervisée et clustering: Modélisation du problème de clustering, algorithme des K-means, modèles de mélanges gaussiens, construction et mise en place de l'agorithme EM.

 

Analyse de jeu données simulés et réels par l'intermédiaire de différents outils: SAS, R et Python en particulier.

 

 

    Parcours / Spécialité / Filière / Option utilisant cette UE :
Date de la dernière mise-à-jour : 21/02/2024
SELECT MEN_ID, `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`, `PAR_ID` FROM parcours INNER JOIN ue_parcours ON PAR_ID_FK=PAR_ID INNER JOIN mention ON MEN_ID = PAR_MENTION_FK WHERE PAR_ACTIVATE = 0 AND UE_ID_FK='18663' ORDER BY `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`