Comment interpréter l’interception de régression logistique (avec exemple)



La régression logistique est une méthode que nous pouvons utiliser pour ajuster un modèle de régression lorsque la variable de réponse est binaire.

Lorsque nous ajustons un modèle de régression logistique, le terme d’origine dans la sortie du modèle représente le log des chances que la variable de réponse se produise lorsque toutes les variables prédictives sont égales à zéro.

Cependant, comme les probabilités logarithmiques sont difficiles à interpréter, nous encadrons généralement l’interception en termes de probabilité.

Nous pouvons utiliser la formule suivante pour comprendre la probabilité que la variable de réponse se produise, étant donné que chaque variable prédictive du modèle est égale à zéro :

P = eβ0 / (1 +eβ0)

L’exemple suivant montre comment interpréter une interception de régression logistique dans la pratique.

Connexes : Comment interpréter les coefficients de régression logistique

Exemple : Comment interpréter l’interception de régression logistique

Supposons que nous souhaitions adapter un modèle de régression logistique utilisant le sexe et le nombre d’examens pratiques passés pour prédire si un étudiant réussira ou non un examen final dans une classe.

Supposons que nous ajustions le modèle à l’aide d’un logiciel statistique (tel que R , Python , Excel ou SAS ) et recevions le résultat suivant :

Estimation du coefficient Erreur standard Valeur Z Valeur P
Intercepter -1,34 0,23 5,83 <0,001
Sexe (Homme = 1) -0,56 0,25 2.24 0,03
Examens pratiques 1.13 0,43 2,63 0,01

Nous pouvons voir que le terme d’origine a une valeur de -1,34 .

Cela signifie que lorsque le sexe est égal à zéro (c’est-à-dire que l’étudiant est une femme) et lorsque les examens pratiques sont égaux à zéro (l’étudiant n’a passé aucun examen pratique en préparation à l’examen final), les chances logarithmiques que l’étudiant réussisse l’examen sont de -1,34. .

Puisque les log odds sont difficiles à comprendre, nous pouvons plutôt réécrire les choses en termes de probabilité :

  • Probabilité de réussite = e β 0 / (1 +e β 0 )
  • Probabilité de réussite = e -1,34 / (1 +e -1,34 )
  • Probabilité de réussite = 0,208

Lorsque les deux variables prédictives sont égales à zéro (c’est-à-dire une étudiante qui n’a passé aucun examen préparatoire), la probabilité que l’étudiant réussisse l’examen final est de 0,208 .

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur la régression logistique :

Comment signaler les résultats de la régression logistique
Comprendre l’hypothèse nulle pour la régression logistique
La différence entre la régression logistique et la régression linéaire

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *