Objectifs de la formation
Approfondir la connaissance de la détection d'anomalies dans un contexte de données numériques et/ou fonctionnelles à l'aide de méthodes principalement non-supervisées
Contenu de la formation
Introduction Qu'est-ce qu'une anomalie ? une valeur influente ? une valeur extrême ? Les différentes motivations à la détection d'anomalies La notion de robustesse Les méthodes univariées La règle du k-sigma et test de Grubbs Règles du boxplot Tests en fonction de la distribution Les méthodes multivariées - généralités Les grandes approches dans la détection d'anomalies Évaluation des méthodes Caractéristiques souhaitées Métriques Contributeurs ou signature des défauts Les méthodes multivariées basées sur un modèle probabiliste T2 de Hotelling, la distance de Mahalanobis et sa version robuste Notion de profondeur et notion d'angles Les méthodes multivariées basées sur la détermination d'un sous-espace L'ACP et sa version robuste Les réseaux de neurones Les méthodes multivariées basées sur la notion de proximité La classification non supervisée Le LOF basé sur la densité Les méthodes pour des données fonctionnelles Introduction au contexte de données fonctionnelles L'analyse de données fonctionnelles Méthode de lissage Spline cubique Polynômes locaux Réduction de dimension Grandeurs statistiques (moyenne…) Décomposition en coefficients d'ondelettes Méthodes de détection d'anomalies dans un contexte univarié Méthodes de détection d'anomalies dans un contexte multivarié Les méthodes pour des données en HDLSS (grande dimension, faible taille d'échantillonnage) Présentation des challenges induits par ce contexte Les principales méthodes
Résultats de la formation
Attestation de formation
Conditions spécifiques d'accès à la formation
Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont les formations statistique descriptive (exploratoire) : savoir decrire des observations et statistique decisionnelle (inferentielle) : savoir decider au vu des observations ou d avoir atteint par la pratique un niveau equivalent