Retour
LE WAGON - DATA SCIENCE Fulltime
Objectifs de la formation
C1 Acquérir des données à partir de sources adaptées, fournies par le client ou accessibles en Open Data afin d'agrémenter la base de données C2 Écrire des requêtes pour l'interrogation de la base de données et les composants d'accès aux données C3 Effectuer des analyses exploratoires afin d'appréhender la composition interne des données C4 Concevoir une représentation graphique adaptée afin de visualiser les relations entre les données C5 Préparer des données en vue de l'apprentissage afin que celles-ci soient nettoyées C6 Transformer des données d'entrée afin de satisfaire les contraintes inhérentes au modèle (Preprocessing) C7 Générer des données d'entrée afin de satisfaire les contraintes inhérentes au modèle (Feature Engineering) C8 Maîtriser les différents algorithmes d'apprentissage afin d'apporter une réponse adaptée à une problématique de l'organisation C9 Entraîner un modèle d'apprentissage supervisé pour optimiser une fonction de prédiction à partir d'exemples annotés C10 Entraîner un modèle d'apprentissage non supervisé pour détecter des structures sous-jacentes à partir de données non étiquetées C11 Améliorer les capacités prédictives d'un système en sélectionnant un modèle différent ou en modifiant ses hyperparamètres en vue de corriger des erreurs (hyperparameter tunnig) C12 Mettre en production le modèle d'apprentissage supervisé ou non supervisé obtenu sous la forme d'une API C13 Adopter une démarche d'amélioration continue en identifiant les axes de perfectionnement d'un produit à l'aide d'une méthode adaptée de manière à améliorer la performance du produit C14 Convertir les données entrantes (images et texte par exemple) en données adaptées pour un réseau de neurones C15 Maîtriser les différentes architectures de réseau de neurones : convolutifs pour les images & récurrents pour les séries temporelles et les modèles de traitement automatique du langage (NLP) pour le texte C16 Utiliser un réseau de neurones convolutifs pour étiqueter des images C17 Utiliser un réseau de neurones pour comprendre l'intention d'une phrase en langage naturel C18 Analyser et formuler une problématique métier du point de vue de l'analyste de données C19 Planification des actions à mettre en oeuvre C20 Mobiliser les ressources nécessaires pour mener à bien le projet en respectant les délais C21 Recommander des actions à sa hiérarchie et rendre compte de ses résultats
Contenu de la formation
Le contenu de la formation professionnelle est le suivant : Semaines 1 et 2 : Data Science Foundations Utiliser et maîtriser les principaux aspects de Python utilisés en Data Science. Apprendre le Data Sourcing à partir d'une liste exhaustive de techniques (CSV, API, Scraping, SQL, etc.). Affiner vos compétences SQL avec des requêtes avancées (JOIN, PARTITION, RANK, etc.). Maîtriser la boîte à outils Data Scientist (Jupyter suite) et effectuer votre première analyse de données avec Pandas. Saisir les concepts mathématiques qui font les bases de la Data Science : statistiques, probabilités et algèbre linéaire. Semaine 3 : Decision Science Travail sur un projet Data Science avec une équipe technique. Semaines 4 et 5 : Machine Learning in Production Découverte du Machine Learning et de la bibliothèque scikit-learn. Modèles d'apprentissage avancés non supervisés. Semaine 6 : Deep Learning Utiliser des réseaux de neurones et transférer vos connaissances pour créer des modèles de reconnaissance d'images, de séries chronologiques et de traitement du langage naturel. Semaine 7: Data Engineering in Production Utilisation de Master Google Cloud Platform pour stocker et récupérer des données avec BigQuery et déployer des modèles en production. Apprendre à «extraire, charger et transformer» des données (ETL) dans un entrepôt de données. Concevoir un pipeline de données pour créer un système robuste et évolutif. Analyse exploratoire à partir d'une interface Jupyter et exécuter des algorithmes d'apprentissage automatique sur la pile Google Cloud. Semaines 8 et 9 : Data Science Project Construire un service de données ou produit de données : un système de recommandations personnalisé, un moteur de recherche, une application de reconnaissance d'images, un outil d'optimisation de la chaîne d'approvisionnement ou une application de promotion et de tarification du commerce électronique.
Résultats de la formation
La formation a pour objectif d'apporter des connaissances fondamentales en Data Science. Elle est utile pour des personnes qui: - Souhaitent se reconvertir et rejoindre une équipe data - Souhaitent acquérir des compétences techniques pour évoluer professionnellement - Souhaitent lancer un business autour des thématiques data Modalités d'évaluation des acquis des stagiaires Tout au long de la formation professionnelle, les stagiaires seront amenés à compléter des exercices quotidiennement. Le stagiaire doit valider au moins 60 exercices et avoir un taux de présence de minimum 80% pour obtenir l'attestation de fin de formation. Concernant la certification, voici les modalités d'obtention du titre Développeur en intelligence artificielle du Wagon enregistré au RNCP (niveau VI) depuis le 16/12/2020 (fiche RNCP: https://www.francecompetences.fr/recherche/rncp/35141/). Épreuves de la certification La certification professionnelle est composée de 2 épreuves et se déroulent sur 2 journées. *Les nombres ci-dessous entre parenthèses correspondent à la part de chaque exercice dans l'évaluation de l'examen*. Epreuve 1 : Elle se divise en 2 exercices sous forme de notebooks: - Un exercice de Decision Science avec remise d'un notebook, d'un schema de base de données (*.xml), de fichiers de tests associés et de diapositives de présentation (42%) - Un exercice de Deep Learning se concentrant sur les réseaux de neurones convolutifs avec remise d'un notebook et des fichiers de tests associés (9.5%) Epreuve 2 : Elle se divise en 2 exercices sous forme de notebooks et d'un code empaqueté: - Un exercice de Deep Learning se concentrant sur les réseaux de neurones récurrents avec remise d'un notebook et des fichiers de tests associés (9.5%) - Un exercice de Machine Learning avec remise d'un notebook, des fichiers de tests associées et d'une API predictive (39%)
Métier formé
Data / Big data
Niveau d'étude visé
Bac+3
Prise en charge
Formation continue éligible au financement via le CPF
Organisme de formation
FAST
Durée de la formation
2 mois
Modalités de formation
formation mixte
Prochaine(s) session(s)
- 21/10/2024 - 20/12/2024