Objectifs de la formation
Le Master 2 Statistique et Informatique pour la Science des données (SISE), du parcours Statistique et Informatique, propose une formation avancée à la data science, avec une forte composante machine learning et statistique d'une part, informatique et technologies big data d'autre part. La complémentarité de ces compétences constitue le socle de la science des données (data science) et de la valorisation des données massives (big data, big data analytics). Les étudiants peuvent se tourner vers les métiers traditionnels de la data science et de la statistique (data scientist, data analyst, ingénieur machine learning, chargés d'études statistiques, consultant data mining, consultant data science, ingénieur score, ...). Ils peuvent également, de par leurs compétences approfondies en informatique en programmation (R et Python), en technologies big data et leurs applications (ex. hadoop, spark, dataviz, ...), en business intelligence et bases de données (conception et exploitation des entrepôts de données, outils ETL, bases de données NoSql, dataviz, …) valoriser un profil de data scientist / data analyst dans le sens d'une synergie réelle entre la statistique / machine learning et l'informatique. Le savoir-faire acquis dans les modules consacrés aux spécialisations et applications (text mining, web mining, analyse des réseaux sociaux, valorisation des données de sécurité) leur permet d'être directement opérationnels dans des environnements exigeants. Ils le sont d'autant plus que près de 40% des enseignants du Master SISE sont assurés par des professionnels. Les étudiants sont ainsi au fait des pratiques et préoccupations récentes des entreprises. Ils sont en prise directe avec les évolutions technologiques particulièrement rapides dans le domaine de la data science. Le Master SISE peut accueillir, au titre de la formation continue, des professionnels en reconversion, qui ont déjà travaillé plusieurs années en entreprises et qui souhaitent s'investir dans la data science. Ils peuvent suivre la formation à titre personnel, ou en accord avec leur entreprise, ou dans le cadre d'un congé individuel de formation, ou disposer de tout autre cadre de financement. Les candidats concernés doivent être pleinement disponibles et suivent les mêmes cours que les étudiants en formation initiale. Les étudiants de notre Master de Science des Données participent au programme académique de DataCamp (DataCamp for the Classroom). Ils y ont accès gratuitement au titre du Master SISE. Ce programme s'étale sur un semestre, il leur permet d'approfondir leurs connaissances en R, Python, statistique, data mining et machine learning, data visualisation (Dataviz) (la liste des enseignements est visible sur le site). Le programme DataCamp aboutit à une certification en Data Science.
Contenu de la formation
Le programme du Master SISE est articulé autour des enseignements fondamentaux, des applications et de la professionnalisation. Les enseignements fondamentaux concernent la maîtrise des méthodes de statistique au sens large, incluant les techniques de modélisation de machine learning et de data mining. L'objectif est que l'apprenant doit comprendre les principes sous-jacents à ces méthodes, leurs mécanismes internes, leur champ d'application. Ils (les enseignements fondamentaux) concernent également l'informatique, qui va largement plus loin que la manipulation des outils. Les étudiants doivent acquérir des compétences fortes dans le développement d'applications de machine learning (développement et déploiement de librairies de calcul, d'applications avec un front-end web, etc.) ; de conception et de gestion des bases de données conventionnelles ou non (NoSQL, lac de données), locales ou dans le cloud ; de manipulation et d'intégration de technologies big data (hadoop, spark, …). Les applications concernent la mise en œuvre des techniques statistiques et de machine learning dans des contextes et sur des données de nature particulière. Il s'agit notamment du traitement des données non-structurées qui sont pléthores aujourd'hui avec le web, mais aussi des images, des informations en provenance des réseaux sociaux collectées à l'aide d'API spécialisées, des données produits par les outils de la sécurité informatique (fichiers logs, …). Au-delà de la simple déclinaison des méthodes statistiques dans ces domaines, ils permettent de développer des approches et des compétences spécifiques valorisables sur le marché du travail. Les applications concernent la mise en œuvre des techniques statistiques et de machine learning dans des contextes et sur des données de nature particulière. Il s'agit notamment du traitement des données non-structurées qui sont pléthores aujourd'hui avec le web, mais aussi des images, des informations en provenance des réseaux sociaux collectées à l'aide d'API spécialisées, des données produits par les outils de la sécurité informatique (fichiers logs, …). Au-delà de la simple déclinaison des méthodes statistiques dans ces domaines, ils permettent de développer des approches et des compétences spécifiques valorisables sur le marché du travail. La professionnalisation enfin concerne en particulier la mise en situation des étudiants dans le monde professionnel. Ils doivent gérer notamment les manifestations promotionnelles de nos formations durant la partie académique de l'année, entres autres : le forum qui consiste à faire venir les entreprises au contact de nos étudiants ; les journées thématiques (Securiday, Dataday, BI-Day, …) où des professionnels
Résultats de la formation
Connaissances à acquérir Maîtriser les méthodes statistiques, de machine learning et de data mining avancées Savoir manipuler les environnements et les technologies big data (hadoop, spark) Savoir concevoir et manipuler les bases de données conventionnelles (entrepôts de données) et non-conventionnelles (NoSQL) Mener et déployer des projets de machine learning et de data science Gérer des études complètes, partant du recueil des besoins, des données, jusqu'au déploiement des modèles Débouchés professionnels Secteurs d'activité ou type d'emploi Les étudiant.es issu.es du parcours Statistique et Informatique pour la Science des donnéEs (SISE) occupent les métiers traditionnels de la data science, du machine learning, de la statistique, et de ses applications : data scientist, statisticien/ne, ingénieur.e statisticien/ne, , data analyst, ingénieur.e machine learning, ingénieur big data, chargé.e puis directeur/trice d'études, biostatisticien/ienne, chargé.e de traitement data mining. Les étudiant.es expriment leur savoir-faire dans tous secteurs où la valorisation des données massives prend une dimension importante : banques, assurances, industrie,distribution, collectivités territoriales, protection sociale, instituts d'études. Les sociétés de service informatique ont également investi le domaine de la science des données et expriment un besoin fort en compétences statistiques.
Conditions spécifiques d'accès à la formation
BAC+4 Formation(s) requise(s) Un niveau solide, ou tout du moins une appétence certaine, en informatique, statistique et mathématiques appliquées. Pour les candidatures extérieures à notre M1 Informatique, un programme de remise à niveau est prévu durant l'été qui précède la rentrée d'octobre. Il est obligatoire. Public ciblé Le Master 2 SISE s'adresse principalement aux titulaires d'une première année de Master dans le domaine de l'informatique, de la statistique, des mathématiques appliquées, ou toute autre formation (Bac+ 4) comportant de solides connaissances en informatique, statistique et mathématique. Une disposition spécifique est prévue pour les personnes en formation continue qui sont dans une démarche de reconversion. De même, les étudiants ayant au moins un niveau Bac + 4 en réorientation sont le bienvenu également. Tout dépend du niveau académique et de la solidité de la démarche du candidat. Pour ces deux types de profils (reconversion ou réorientation), un programme de remise à niveau à suivre durant l'été précédent la rentrée a été mis en place. Il est obligatoire pour ces candidats. Il constitue la condition sine qua non de la réussite de ces profils. Les candidats doivent avoir le niveau requis pour attaquer directement l'année au même titre que les étudiants provenant de nos filières habituelles à la rentrée d'octobre.