Retour

Python pour la Data Science

Objectifs de la formation

Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science

Contenu de la formation

- L'écosystème scientifique Python Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques Panorama des librairies et logiciels scientifiques par domaine Les critères permettant de juger de la qualité d'une librairie - Calculer avec des nombres réels: comprendre les erreurs de calculs La représentation des nombres réels Comprendre les erreurs de calculs et les contourner - La scipy stack Manipuler des tableaux de nombres: Numpy Différences avec les listes Python Création, sélection, filtres et principales fonctions Visualiser ses données: Matplotlib Les concepts de la librairie Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ... Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ... Analyse de données: Pandas Les fondements de la librairie: Manipuler des données de type CSV et Excel Séries et Dataframes Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées Manipuler des séries temporelles Les fonctions mathématiques avancées: Scipy Statistiques, optimisation, interpolations/régressions, traitement d'images - Visualisation de données Présentation de l'écosystème de visualisation de données de Python Les librairies orientées Web: Bokeh, Altair et Plotly Les "écosystèmes" PyViz et HoloViz La visualisation de données volumineuses/big data avec DataShader Les statistiques avec Seaborn - Visualiser des données géospatiales Convertir ses données d'un système de coordonnées à l'autre Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet Cartographie statique avec Cartopy Autres librairies géospatiales - Manipulation de données volumineuses Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques Paralléliser ses calculs avec Dask Paralléliser ses calculs avec CuDF Manipuler des dataframes gigantesques avec Dask - Personnalisation Sous réserve de contraintes techniques ou de confidentialité, nous vous pr

Résultats de la formation

Attestation de formation

Conditions spécifiques d'accès à la formation

Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formationPython - Bases et introduction aux librairies scientifiquesou d avoir atteint par la pratique un niveau equivalent

Formation 100% en ligne

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Data Value

Durée de la formation

19 mois

Prochaine(s) session(s)

  • 01/01/2025 - 31/07/2026