* Ces horaires sont donnés à titre indicatif.
● Tour d’horizon des problèmes & types d’apprentissage (supervisé/non supervisé, classification/régression, single/multi output, structuré/non structuré, statistiques ou non, etc.).
● Principaux modèles et algorithmes d’apprentissage supervisé (modèles linéaires, réseaux de neuronnes, arbres de décision, Bagging, Random Forest, Boosting) et d’apprentissage non supervisé (K-means, clustering hiérarchiques, etc.)
● Les concepts importants préparation de données, fonctions coût, critères de performance, overfitting, dilemme biais-variance, validation croisée, données déséquilibrées, données manquantes, création des variables, etc..
● Sélection de variables et de modèles
● Apprentissage multi-label et multi-régression
● Détection d’anomalies
● Text Mining : Préparation de données, TF-IDF, LSI, Word Embedding, etc.
● Mise en pratique sur des jeux de données avec scikit-learn[1] sous Python sur des cas d'études réels.