Université Lyon 1
Arqus
Accueil  >>  Science de la donnée numérique
  • Unité d'enseignement : Science de la donnée numérique
Nombre de crédits de l'UE : 3
Code APOGEE : INF2429M
    Responsabilité de l'UE :
BERTIN MARC
 marc.bertinuniv-lyon1.fr
04.72.43.13.98
BOUKACEM-ZEGHMOURI CHERIFA
 cherifa.boukacem-zeghmouriuniv-lyon1.fr
04.72.44.58.34
    Type d'enseignement
Nb heures *
Cours Magistraux (CM)
6 h
Travaux Dirigés (TD)
21 h
Travaux Pratiques (TP)
0 h
Durée de projet en autonomie (PRJ)
0 h
Durée du stage
0 h
Effectif Cours magistraux (CM)
210 étudiants
Effectif Travaux dirigés (TD)
35 étudiants
Effectif Travaux pratiques (TP)
18 étudiants

* Ces horaires sont donnés à titre indicatif.

    Compétences attestées (transversales, spécifiques) :
Non rédigé
    Programme de l'UE / Thématiques abordées :

Ce cours doit apporter les bases théoriques nécessaires pour une bonne compréhension des approches mis en œuvre dans les domaines de l’Intelligence Artificielle (IA), du Traitement Automatique des Langues (TAL),  et de la Recherche d’Information (RI) appliquées. Il portera sur une compréhension méthodologique qualitative et quantitative de l’information.

Le cours porte sur une présentation et une mise en application des technologies de l’IA, du TAL, de la lexicométrie et la recherche d’information, soit à travers une œuvre de synthèse, soit une mise en œuvre plus informatique. L’approche méthodologique et pédagogique portera sur des projets de fouilles, de traitement et d’exploitation de données provenant de l’IST : Données médicales, bibliographiques, scientifiques, technologiques, brevet, textuelles, enquêtes, base de données, etc.

Les compétences développées sont une maîtrise de l’exploitation des données scientifiques et techniques. Les étudiants doivent maîtriser en fin de cursus, les fondamentaux pour la rédaction de cahier de charge et des capacités d’analyse propres à l’IST, à savoir des compétences techniques (quantitatif) mais aussi méthodologique (qualitatives) avec une capacité de navigation entre les deux modes de conceptualisation.

1 – Les données de l’IST,

2 – Le Traitement Automatique des Langues et l’IA

3 – Les Données, qu’elles soient BIG, BAD ou SMART

4 – La Recherche d’Information Avancées

5 – Les algorithmes mise en œuvre en IST (IA, RI et TAL)

6 – R et/ou python et l’exploitation des données de l’IST

7 – Les mathématiques de l’IST

8 – Bibliométrie et TAL : Enjeux et perspectives

9 – Le Document scientifique de demain : le triptyque Texte-Code-Donnée

 

Modalités de contrôle de connaissance : CCI

 

Bibliographie indicative

 

-       Berry, G. L'hyperpuissance de l'informatique Odile Jacob, 2017

-       Kembellec, G. Écrilecture augmentée dans les communautés scientifiques ISTE editions, 2017

-       Pain, M. & Boukacem-Zeghmouri, C. Les données de la recherche et leurs entrepôts, de la documentation à la réutilisation, 2016

-       CNRS, «Mieux partager l’IST » : Enquête nationale conjointe auprès des Universités, Organismes et Grandes Écoles sur le Partage et la Gestion des ressources d’IST : Pré-rapport du 11 octobre 2016 / Direction de l’Information Scientifique et Technique – CNRS, 2016

-       Lafouge, T. & Pouchot, S. Statistiques de l'intellect Publibook, 2012, 236 pages

-       Iana Atanassova, Marc Bertin, Philipp Mayr. Mining Scientific Papers: NLP-enhanced Bibliometrics. Chaomei Chen. Frontiers in Research Metrics and Analytics, 2019, Research Topic.

SELECT MEN_ID, `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`, `PAR_ID` FROM parcours INNER JOIN ue_parcours ON PAR_ID_FK=PAR_ID INNER JOIN mention ON MEN_ID = PAR_MENTION_FK WHERE PAR_ACTIVATE = 0 AND UE_ID_FK='21886' ORDER BY `MEN_DIP_ABREVIATION`, `MEN_TITLE`, `PAR_TITLE`