Retour
Régression linéaire, logistique et analyse de la variance
Objectifs de la formation
Objectifs Acquérir la connaissance méthodologique et pratique des méthodes de modélisation que sont la régression linéaire, la régression logistique, l'analyse de la variance et de la covariance. Elles permettent d'obtenir une analyse explicative d'un phénomène, de confirmer des hypothèses, de prendre des décisions ou encore d'effectuer des prévisions Compétences visées - Connaître l'intérêt, le principe et l'écriture d'un modèle linéaire - Mettre en oeuvre une régression linéaire simple et multiple, savoir interpréter les coefficients de la régression, étudier les résidus, tester la significativité des paramètres de la régression - Savoir appliquer la méthode de la régression logistique, interpréter les coefficients de la régression, tester la significativité des paramètres - Savoir mener une analyse de la variance et de la covariance, identifier les effets principaux et les effets des interactions, tester les hypothèses du modèle, et connaître les différents types de modèles
Contenu de la formation
- Le modèle linéaire Introduction Le modèle linéaire, principe, écriture - Régression simple et multiple Le modèle Estimation des coefficients Validation du modèle Tableau d'analyse de variance et coefficient de détermination (R2) Test global du modèle : le test de Fisher Test de nullité de chacun des coefficients du modèle : le test de Student Recherche de valeurs influentes Etude graphique et statistique des résidus Liaisons entre variables explicatives : évaluer le degré de multicolinéarité, utilisation de l'analyse en composantes principales Critères de sélection de modèles concurrents Critères de sélection de modèles : coefficient de détermination, coefficient de détermination ajusté, Cp de Mallow Méthodes pas à pas de sélection de modèle : ascendante, descendante, mixte Utilisation du modèle en prévision Intervalle de confiance et de prévision - Régression logistique Spécificité et complémentarité avec la régression linéaire classique Spécification du modèle Hypothèses Fonction logit Interprétation des paramètres du modèle Intervalle de confiance Estimation des paramètres du modèle Tests d'hypothèses sur les paramètres du modèle Codage et interprétation des variables explicatives (binaire, qualitative) Comparaison de modèles et sélection de variables Validation des hypothèses du modèle et analyse des résidus - Analyse de la variance et de la covariance Le modèle Analyse de la variance à un ou plusieurs facteurs Décomposition de la variance Effets principaux et effets des interactions Analyse de la covariance Vérification des hypothèses sur les données, validation du modèle Tests de normalité des distributions, d'homogénéité des variances (homoscedasticité), transformation des données Utilisation des boîtes à moustaches Etude graphique et statistique des résidus Tests d'hypothèses, exploitation Tests de comparaisons multiples de moyennes (Tukey, Bonferroni, ...) Tests de type I, II, III Analyse de contraste pour vérifier une hypothèse de départ Cas des plans déséquilibrés Les différents types de modèles Modèles croisés Modèles imbriqués Mesures répétées
Résultats de la formation
Attestation d'acquis ou de compétences;Attestation de suivi de présence
Conditions spécifiques d'accès à la formation
Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formation Statistique decisionnelle (inferentielle) : savoir decider au vu des observations
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Data Value
Durée de la formation
1 mois
Modalités de formation
formation entièrement présentielle
Prochaine(s) session(s)
- 18/11/2024 - 20/11/2024