Inference & modeling (stats)
•Statistiques: incertitudes, estimateurs, tests d'hypothèse, prédictions
•Vraisemblance
•Gaussian Process
•Analyse bayésienne, MCMC
•Robustesse et outliers
•Outils: iminuit, sklearn, emcee/pymc3, stan
Apprentissage automatique (ML)
•Types d'apprentissage: supervisé ou non-supervisé (+ semi-supervisé, par renforcement, par transfert)
•Types d’algorithmes: régression, classification, partitionnement, réduction de dimension
•Supervised Learning algorithm : Classification, Logistic Regression, Support Vector Machine, Decision Trees & RandomForests ...
•Dimensionality reduction : PCA, manifold learning
•Unsupervised Learning algorithm : Clustering
•Deep Learning / Neural Network : CNN , Object Detection (YOLO, FCNs)
•Modèles
•Réseaux de neurones
•Arbres de décision
•Machines à vecteur de support (SVM)
•Régression
•Réseau bayésien (DAG)
•Algorithmes génétiques
•Étapes d'un projet de ML: acquisition des données, exploration, préparation, extraction, modèle d'apprentissage, entraînement, optimisation, test et utilisation
•Limitations: biais, sur-ajustements
•Librairies: pytorch, tensorflow, keras, scikit-learn
Production et Performances
•Intro aux bases de données relationnelles (SQL, Django) et no-SQL
•Compression des données
•Optimisation: numba, cython
•Parallélisation: mpi
•Calculs distribués: pool, joblib, Dask, MapReduce, Spark
•GPU: pycuda, rapids.ai
•Cloud