Retour
Python pour la Data Science
Objectifs de la formation
Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science
Contenu de la formation
- L'écosystème scientifique Python Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques Panorama des librairies et logiciels scientifiques par domaine Les critères permettant de juger de la qualité d'une librairie - Calculer avec des nombres réels: comprendre les erreurs de calculs La représentation des nombres réels Comprendre les erreurs de calculs et les contourner - La scipy stack Manipuler des tableaux de nombres: Numpy Différences avec les listes Python Création, sélection, filtres et principales fonctions Visualiser ses données: Matplotlib Les concepts de la librairie Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ... Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ... Analyse de données: Pandas Les fondements de la librairie: Manipuler des données de type CSV et Excel Séries et Dataframes Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées Manipuler des séries temporelles Les fonctions mathématiques avancées: Scipy Statistiques, optimisation, interpolations/régressions, traitement d'images - Visualisation de données Présentation de l'écosystème de visualisation de données de Python Les librairies orientées Web: Bokeh, Altair et Plotly Les "écosystèmes" PyViz et HoloViz La visualisation de données volumineuses/big data avec DataShader Les statistiques avec Seaborn - Visualiser des données géospatiales Convertir ses données d'un système de coordonnées à l'autre Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet Cartographie statique avec Cartopy Autres librairies géospatiales - Manipulation de données volumineuses Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques Paralléliser ses calculs avec Dask Paralléliser ses calculs avec CuDF Manipuler des dataframes gigantesques avec Dask - Personnalisation Sous réserve de contraintes techniques ou de confidentialité, nous vous pr
Résultats de la formation
Attestation de formation
Conditions spécifiques d'accès à la formation
Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formationPython - Bases et introduction aux librairies scientifiquesou d avoir atteint par la pratique un niveau equivalent
Formation 100% en ligne
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Data Value
Durée de la formation
19 mois
Prochaine(s) session(s)
- 01/01/2025 - 31/07/2026