Comment interpréter les coefficients de régression logistique (avec exemple)



La régression logistique est une méthode que nous pouvons utiliser pour ajuster un modèle de régression lorsque la variable de réponse est binaire.

Lorsque nous ajustons un modèle de régression logistique, les coefficients des résultats du modèle représentent la variation moyenne du log de probabilité de la variable de réponse associée à une augmentation d’une unité de la variable prédictive.

β = Average Change in Log Odds of Response Variable

Nous souhaitons souvent comprendre la variation moyenne des probabilités de la variable de réponse associée à une augmentation d’une unité de la variable prédictive, que nous pouvons trouver en utilisant la formule e β .

eβ = Average Change in Odds of Response Variable

L’exemple suivant montre comment interpréter les coefficients de régression logistique dans la pratique.

Exemple : Comment interpréter les coefficients de régression logistique

Supposons que nous souhaitions adapter un modèle de régression logistique utilisant le sexe et le nombre d’examens pratiques passés pour prédire si un étudiant réussira ou non un examen final dans une classe.

Supposons que nous ajustions le modèle à l’aide d’un logiciel statistique (tel que R , Python , Excel ou SAS ) et recevions le résultat suivant :

Estimation du coefficient Erreur standard Valeur Z Valeur P
Intercepter -1,34 0,23 5,83 <0,001
Genre masculin) -0,56 0,25 2.24 0,03
Examens pratiques 1.13 0,43 2,63 0,01

Comment interpréter le genre (variable prédictive binaire)

Nous pouvons voir que l’estimation du coefficient pour le sexe est négative, ce qui indique qu’être un homme diminue les chances de réussir l’examen.

Nous pouvons également voir que la valeur p pour le sexe est inférieure à 0,05, ce qui signifie qu’elle a un effet statistiquement significatif sur la réussite ou non d’un individu à l’examen.

Pour comprendre exactement comment le fait d’être un homme affecte la réussite ou non d’un individu à l’examen, nous pouvons utiliser la formule e β .

e -0,56 = 0,57

Nous interprétons cela comme signifiant que les hommes ont seulement 0,57 fois plus de chances que les femmes de réussir l’examen, en supposant que le nombre d’examens pratiques reste constant .

Nous pourrions également dire que les hommes ont (1 – 0,57) 43 % de chances de réussir l’examen en moins que les femmes, en supposant encore une fois que le nombre d’examens pratiques reste constant .

Comment interpréter les examens pratiques (variable prédictive continue)

Nous pouvons voir que l’estimation du coefficient pour les examens pratiques est positive, ce qui indique que chaque examen pratique supplémentaire passé augmente les chances de réussite à l’examen final.

Nous pouvons également constater que la valeur p pour le nombre d’examens pratiques passés est inférieure à 0,05, ce qui signifie qu’elle a un effet statistiquement significatif sur la réussite ou non d’un individu à l’examen final.

Pour quantifier l’impact de chaque examen pratique supplémentaire sur la réussite ou non d’un individu à l’examen final, nous pouvons utiliser la formule e β .

e 1,13 = 3,09

Nous interprétons cela comme signifiant que chaque examen pratique supplémentaire passé multiplie les chances de réussite à l’examen final par 3,09 , en supposant que le sexe reste constant .

Nous pourrions également dire que chaque examen pratique supplémentaire passé est associé à une augmentation (3,09 – 1) de 209 % des chances de réussite à l’examen final, encore une fois en supposant que le sexe reste constant.

Remarque : reportez-vous à cet article pour savoir comment interpréter le terme d’origine dans un modèle de régression logistique.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur la régression logistique :

Comment signaler les résultats de la régression logistique
Comprendre l’hypothèse nulle pour la régression logistique
La différence entre la régression logistique et la régression linéaire

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *