Les banques, assurances ou autres entreprises financières, dont les sociétés des services, se basent sur l’IA, dont le machine learning fait partie, pour interpréter les données et réduire les risques de fraude mais également sur les techniques de simulation pour envisager les impacts et la sensibilité des processus.
Cela requière une manipulation avancée des données dans la gestion des risques :
- La préparation des données : nettoyage et mise en production (transformation des données dépendantes en étiquettes et des variables en caractéristiques);
- Les algorithmes de bases et avancés permettant l’identification d’opportunité dans le temps pour investir au meilleur moment, mais également de détecter les clients présentant des risques ou d’identifier les signaux révélateurs de fraude avec une modélisation de systèmes interdépendants;
- Les méthodes de régression (Linéaire, PLS, logistique) pour évaluation des impacts;
- Les méthodes de simulation de données :
- Méthodes de tirages aléatoires (tirage aléatoire simple avec et sans remise, tirage aléatoire simple avec strate ou méthode des quotas, tirage pseudo-aléatoire (tirage par grappes, tirage systématique, tirage selon probabilité proportionnelle à une taille))
- Rééchantillonage par méthode bootstrap
- Estimation d’intervalle de confiances;
- Le processus d’automatisation et itératifs permet le passage en production des modèles et expériences acquises par les algorithmes;
- L’évolutivité pour envisager une récurrence dans la performance des algorithmes avec l’introduction de nouvelles étiquettes au cours du temps.