Comment calculer l’intervalle de confiance pour la pente de régression



La régression linéaire simple est utilisée pour quantifier la relation entre une variable prédictive et une variable de réponse.

Cette méthode trouve une ligne qui « correspond » le mieux à un ensemble de données et prend la forme suivante :

ŷ = b 0 + b 1 x

où:

  • ŷ : La valeur de réponse estimée
  • b 0 : L’origine de la droite de régression
  • b 1 : La pente de la droite de régression
  • x : La valeur de la variable prédictive

Nous sommes souvent intéressés par la valeur de b 1 , qui nous indique le changement moyen de la variable de réponse associé à une augmentation d’une unité de la variable prédictive.

Nous pouvons utiliser la formule suivante pour calculer un intervalle de confiance pour la valeur de β 1 , la valeur de la pente pour la population globale :

Intervalle de confiance pour β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

où:

  •   b 1 = Coefficient de pente indiqué dans le tableau de régression
  • t 1-∝/2, n-2 = La valeur critique t pour le niveau de confiance 1-∝ avec n-2 degrés de liberté où n est le nombre total d’observations dans notre ensemble de données
  • se(b 1 ) = L’erreur type de b 1 indiquée dans le tableau de régression

L’exemple suivant montre comment calculer un intervalle de confiance pour une pente de régression dans la pratique.

Exemple : intervalle de confiance pour la pente de régression

Supposons que nous souhaitions ajuster un modèle de régression linéaire simple utilisant les heures étudiées comme variable prédictive et les résultats à l’examen comme variable de réponse pour 15 étudiants d’une classe particulière :

Nous pouvons effectuer une régression linéaire simple dans Excel et recevoir le résultat suivant :

En utilisant les estimations de coefficients dans le résultat, nous pouvons écrire le modèle de régression linéaire simple ajusté comme suit :

Score = 65,334 + 1,982*(Heures étudiées)

La valeur de la pente de régression est 1,982 .

Cela nous indique que chaque heure supplémentaire d’étude consacrée est associée à une augmentation moyenne de 1,982 de la note à l’examen.

Nous pouvons utiliser la formule suivante pour calculer un intervalle de confiance à 95 % pour la pente :

  • IC à 95 % pour β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • IC à 95 % pour β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • IC à 95 % pour β 1 : 1,982 ± 2,1604 * 0,248
  • IC à 95 % pour β 1 : [1,446, 2,518]

L’intervalle de confiance à 95 % pour la pente de régression est [1,446, 2,518] .

Étant donné que cet intervalle de confiance ne contient pas la valeur 0, nous pouvons conclure qu’il existe une association statistiquement significative entre les heures étudiées et la note à l’examen.

Remarque : Nous avons utilisé le calculateur de distribution t inverse pour trouver la valeur critique t qui correspond à un niveau de confiance de 95 % avec 13 degrés de liberté.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur la régression linéaire :

Introduction à la régression linéaire simple
Introduction à la régression linéaire multiple
Comment lire et interpréter un tableau de régression
Comment signaler les résultats de la régression

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *