* Ces horaires sont donnés à titre indicatif.
Être capable d’identifier la nature du problème posé par l’exploitation d’une base de données, de réaliser une sélection de méthodes adaptées à ce problème et en choisir des implémentations applicables au volume de données considérées.
Cet enseignement vient renforcer les connaissances acquises au cours du programme de « Data Mining, Text Mining et Data visualisation » et les approfondir. Il offre également une ouverture sur les outils pouvant intervenir dans un contexte lié au phénomène du Big Data.
Les méthodes (forêts d’arbres aléatoires, réseaux de neurones...) seront expérimentées dans une démarche de recherche de performance. Elles seront également considérées dans le contexte d’une volumétrie de données importante et les adaptations envisageables dans ce contexte seront explorées et appliquées. Pour cela, les outils nécessaires à l’optimisation de code seront pris en main, et une approche par parallélisation des calculs en mémoire partagée ou distribuée sera mise en œuvre.