Retour

Détection d'anomalies - Outlier Detection

Objectifs de la formation

Objectifs Approfondir la connaissance de la détection d'anomalies dans un contexte de données numériques et/ou fonctionnelles à l'aide de méthodes principalement non-supervisées Compétences visées - Différencier une anomalie des valeurs influentes et extrêmes - Comprendre l'intérêt de détecter les anomalies - Mettre en oeuvre différentes méthodes statistiques pour la détection selon le contexte des données : méthodes univariées, méthodes multivariées basées sur un modèle probabiliste, sur la détermination d'un sous-espace ou sur la notion de proximité, méthodes pour des données fonctionnelles, méthodes pour des données en HDLSS

Contenu de la formation

-Introduction -Qu'est-ce qu'une anomalie ? une valeur influente ? une valeur extrême ? -Les différentes motivations à la détection d'anomalies -La notion de robustesse -Les méthodes univariées -La règle du k-sigma et test de Grubbs -Règles du boxplot -Tests en fonction de la distribution -Les méthodes multivariées - généralités -Les grandes approches dans la détection d'anomalies -Évaluation des méthodes o Caractéristiques souhaitées o Métriques o Contributeurs ou signature des défauts -Les méthodes multivariées basées sur un modèle probabiliste -T2 de Hotelling, la distance de Mahalanobis et sa version robuste -Notion de profondeur et notion d'angles -Les méthodes multivariées basées sur la détermination d'un sous-espace -L'ACP et sa version robuste -Les réseaux de neurones -Les méthodes multivariées basées sur la notion de proximité -La classification non supervisée -Le LOF basé sur la densité -Les méthodes pour des données fonctionnelles -Introduction au contexte de données fonctionnelles -L'analyse de données fonctionnelles o Méthode de lissage -Spline cubique -Polynômes locaux o Réduction de dimension -Grandeurs statistiques (moyenne...) -Décomposition en coefficients d'ondelettes -Méthodes de détection d'anomalies dans un contexte univarié -Méthodes de détection d'anomalies dans un contexte multivarié -Les méthodes pour des données en HDLSS (grande dimension, faible taille d'échantillonnage) -Présentation des challenges induits par ce contexte -Les principales méthodes

Résultats de la formation

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Conditions spécifiques d'accès à la formation

Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont les formations Statistique descriptive (exploratoire) : savoir decrire des observations et Statistique decisionnelle (inferentielle) : savoir decider au vu des observations.

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Data Value

Durée de la formation

1 mois

Modalités de formation

formation entièrement présentielle

Prochaine(s) session(s)

  • 02/12/2024 - 03/12/2024

Lieu de formation

54 Rue du Faubourg Saint-Antoine 75012 Paris 12e