Retour

Data Analyst | Initiation

Objectifs de la formation

· Acquérir les compétences de base en langage Python pour la manipulation de données. · Maîtriser Jupyter Notebook, Numpy, Pandas, Matplotlib, Seaborn, et Scikit-learn. · Repérer et corriger les erreurs dans les jeux de données. · Utiliser l'algèbre relationnelle et SQL. · Analyser les tendances centrales et la dispersion. · Appliquer les techniques de corrélation, ANOVA, et test du khi-2. · Structurer un rapport statistique impactant. · Maîtriser les représentations graphiques avec Matplotlib et Seaborn. · Comprendre les espaces vectoriels euclidiens, réduire la dimension avec l'ACP. · Utiliser des algorithmes de clustering et la classification hiérarchique.

Contenu de la formation

Module 1: Établir les Fondements Python pour l'Analyse de Données Apprendre les bases du langage Python et utiliser Jupyter Notebook. Acquérir des compétences en statistiques descriptives et inférentielles. Module 2: Maîtriser les Librairies Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn Explorer et maîtriser les bibliothèques clés pour le traitement des données. Effectuer des calculs statistiques et algébriques, ainsi que des visualisations. Module 3: Détecter et Corriger les Erreurs dans les Données Développer des compétences pour identifier et corriger les erreurs dans les jeux de données. Appliquer des techniques efficaces de nettoyage des données. Module 4: Utiliser l'Algèbre Relationnelle avec SQL Comprendre les principes de l'algèbre relationnelle. Manipuler l'information à travers le langage SQL. Module 5: Explorer les Mesures de Tendance Centrale et de Dispersion Analyser les tendances centrales, y compris la moyenne, la médiane et le mode. Examiner les mesures de dispersion telles que l'écart-type, la variance et l'étendue. Module 6: Appliquer l'Analyse des Corrélations et les Tests Statistiques Utiliser des techniques d'analyse de corrélation. Intégrer le modèle d'ANOVA et le test du khi-2. Module 7: Concevoir un Rapport Statistique Impactant Structurer un rapport percutant pour une communication efficace. Sélectionner les informations clés pour une présentation claire. Module 8: Maîtriser les Techniques de Représentation Graphique des Données Utiliser des techniques graphiques avancées avec Matplotlib et Seaborn. Module 9: Comprendre les Espaces Vectoriels Euclidiens et la Réduction de Dimension Assimiler les concepts d'espaces vectoriels euclidiens. Appliquer la réduction de dimension avec l'ACP.

Résultats de la formation

Non renseigné

Conditions spécifiques d'accès à la formation

Aucune

Formation 100% en ligne

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

EVOLUTION5

Durée de la formation

12 mois

Prochaine(s) session(s)

  • 01/01/2024 - 31/12/2024