Retour

Text Mining

Objectifs de la formation

Découvrir comment décrire, comparer, classer, analyser des ensembles de textes. Il peut s'agir de textes littéraires, scientifiques (bibliométrie, recherche documentaire), économiques, sociologiques (réponses aux questions ouvertes dans des enquêtes socio-économiques, entretiens divers en marketing, psychologie appliquée, pédagogie, médecine), de textes historiques, politiques…

Contenu de la formation

- Introduction Présentation de l'analyse statistique textuelle Domaines d'application Exemples d'utilisation Présentation du logiciel de traitement - Importation des données Les diverses natures et sources de données textuelles utilisables Procédures d'importation selon la nature des données Exemples d'importation - Codification : du texte brut au tableau statistique Données textuelles et données contextuelles Création du tableau lexical : la création des documents Prétraitement des données textuelles (mise en forme, lemmatisation) Dictionnaire des termes -Analyse descriptive Calcul de la fréquence de mots : identifier les termes ou concepts les plus récurrents Bilan lexical par document, par variable de contexte Table de dissimilarité entre documents ou entre modalités de variable contexte Spécificités : termes sur- ou sous-représentés dans une modalité d'une variable de contexte Co-occurrences : termes spécifiques des documents qui contiennent un terme donné. Contexte dans lequel un mot est cité, permet d'éclairer le sens du texte Nuage de mots (« word_cloud ») - Analyse multidimensionnelle Permet de révéler le sens profond des données textuelles et de synthétiser l'information contenue dans les données Analyse factorielle des correspondances (Examen multidimensionnel du lien des termes entre eux, avec les documents et avec les variables de contexte) Classification ascendante hiérarchique des documents en groupes homogènes au regard des termes et des variables de contexte - Traitement complet d'un exemple réel

Résultats de la formation

Attestation de formation

Conditions spécifiques d'accès à la formation

Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formationStatistique descriptive (exploratoire) : savoir decrire des observationsou d avoir atteint par la pratique un niveau equivalent

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Data Value

Durée de la formation

1 mois

Modalités de formation

formation entièrement présentielle

Prochaine(s) session(s)

  • 01/09/2025 - 03/09/2025

Lieu de formation

41 rue de la Decouverte 37623 31676 Labège