Retour
Data | Nettoyer des données
Objectifs de la formation
• Importer des données avec Pandas depuis diverses sources. • Comprendre la structure et la distribution des données. • Supprimer les doublons. • Gérer les valeurs manquantes par imputation. • Identifier et traiter les valeurs aberrantes. • Normaliser les données. • Convertir les données catégoriques. • Explorer les relations entre les variables. • Analyser les tendances temporelles. • Préparer les données pour l'analyse avancée et la visualisation.
Contenu de la formation
Module 1: Importer des Données Utiliser Pandas pour importer des données depuis différentes sources. Maîtriser l'importation de fichiers CSV, Excel, bases de données, etc. Module 2: Comprendre les Données Explorer la structure des données. Identifier les types de variables et comprendre la distribution des données. Module 3: Gérer les Doublons Identifier et supprimer les doublons dans les jeux de données. Module 4: Nettoyer les Valeurs Manquantes Identifier les valeurs manquantes dans les données. Appliquer des techniques de gestion des données manquantes, telles que l'imputation. Module 5: Traiter les Valeurs Aberrantes Identifier les valeurs aberrantes et comprendre leur impact sur l'analyse. Appliquer des méthodes pour détecter et gérer les valeurs aberrantes. Module 6: Normaliser les Données Comprendre l'importance de la normalisation des données. Appliquer des techniques de normalisation pour rendre les données comparables. Module 7: Gérer les Données Catégoriques Convertir les données catégoriques en formats appropriés pour l'analyse. Explorer les techniques d'encodage et de gestion des catégories. Module 8: Explorer les Relations entre les Variables Utiliser des méthodes statistiques pour explorer les relations entre les variables. Identifier les corrélations et les associations dans les données. Module 9: Analyser les Tendances Temporelles Identifier les composantes temporelles dans les données. Appliquer des méthodes d'analyse temporelle pour comprendre les tendances. Module 10: Préparer des Données Exploitables Agréger, transformer et filtrer les données pour les rendre exploitables. Préparer les données pour des analyses plus avancées et la création de visualisations. Nous pouvons adapter et personnaliser le programme en fonction de vos besoins par des compléments. N'hésitez pas à nous contacter pour ajuster le programme de votre formation !
Résultats de la formation
Non renseigné
Conditions spécifiques d'accès à la formation
Aucune
Formation 100% en ligne
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
EVOLUTION5
Durée de la formation
12 mois
Prochaine(s) session(s)
- 01/01/2024 - 31/12/2024