Retour
Data Analyst | Initiation
Objectifs de la formation
· Acquérir les compétences de base en langage Python pour la manipulation de données. · Maîtriser Jupyter Notebook, Numpy, Pandas, Matplotlib, Seaborn, et Scikit-learn. · Repérer et corriger les erreurs dans les jeux de données. · Utiliser l'algèbre relationnelle et SQL. · Analyser les tendances centrales et la dispersion. · Appliquer les techniques de corrélation, ANOVA, et test du khi-2. · Structurer un rapport statistique impactant. · Maîtriser les représentations graphiques avec Matplotlib et Seaborn. · Comprendre les espaces vectoriels euclidiens, réduire la dimension avec l'ACP. · Utiliser des algorithmes de clustering et la classification hiérarchique.
Contenu de la formation
Module 1: Établir les Fondements Python pour l'Analyse de Données Apprendre les bases du langage Python et utiliser Jupyter Notebook. Acquérir des compétences en statistiques descriptives et inférentielles. Module 2: Maîtriser les Librairies Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn Explorer et maîtriser les bibliothèques clés pour le traitement des données. Effectuer des calculs statistiques et algébriques, ainsi que des visualisations. Module 3: Détecter et Corriger les Erreurs dans les Données Développer des compétences pour identifier et corriger les erreurs dans les jeux de données. Appliquer des techniques efficaces de nettoyage des données. Module 4: Utiliser l'Algèbre Relationnelle avec SQL Comprendre les principes de l'algèbre relationnelle. Manipuler l'information à travers le langage SQL. Module 5: Explorer les Mesures de Tendance Centrale et de Dispersion Analyser les tendances centrales, y compris la moyenne, la médiane et le mode. Examiner les mesures de dispersion telles que l'écart-type, la variance et l'étendue. Module 6: Appliquer l'Analyse des Corrélations et les Tests Statistiques Utiliser des techniques d'analyse de corrélation. Intégrer le modèle d'ANOVA et le test du khi-2. Module 7: Concevoir un Rapport Statistique Impactant Structurer un rapport percutant pour une communication efficace. Sélectionner les informations clés pour une présentation claire. Module 8: Maîtriser les Techniques de Représentation Graphique des Données Utiliser des techniques graphiques avancées avec Matplotlib et Seaborn. Module 9: Comprendre les Espaces Vectoriels Euclidiens et la Réduction de Dimension Assimiler les concepts d'espaces vectoriels euclidiens. Appliquer la réduction de dimension avec l'ACP.
Résultats de la formation
Non renseigné
Conditions spécifiques d'accès à la formation
Aucune
Formation 100% en ligne
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
EVOLUTION5
Durée de la formation
12 mois
Prochaine(s) session(s)
- 01/01/2024 - 31/12/2024