Excel : Comment interpréter les valeurs P dans la sortie de régression



La régression linéaire multiple est utilisée pour quantifier la relation entre deux ou plusieurs variables prédictives et une variable de réponse .

Chaque fois que nous effectuons une régression linéaire multiple, nous sommes toujours intéressés par les valeurs p dans le résultat pour déterminer si la relation entre les variables prédictives et la variable de réponse est statistiquement significative.

Ce didacticiel explique comment interpréter les valeurs p dans la sortie d’un modèle de régression linéaire multiple dans Excel.

Exemple : Interprétation des valeurs P dans la sortie de régression dans Excel

Supposons que nous voulions savoir si le nombre d’heures passées à étudier et le nombre d’examens préparatoires passés affectent la note qu’un étudiant obtient à un certain examen d’entrée à l’université.

Pour explorer cette relation, nous pouvons effectuer une régression linéaire multiple en utilisant les heures étudiées et les examens préparatoires passés comme variables prédictives et les résultats de l’examen comme variable de réponse.

La capture d’écran suivante montre la sortie de régression de ce modèle dans Excel :

Sortie de régression linéaire multiple dans Excel

Il y a trois valeurs p que nous devrions examiner dans le résultat :

  • Valeur P du modèle global
  • Valeur P de la première variable prédictive (heures)
  • Valeur P de la deuxième variable prédictive (examens préparatoires)

Voici comment interpréter chaque valeur p :

Valeur P du modèle global

La valeur p du modèle global se trouve dans la colonne intitulée Signification F dans le résultat.

Nous pouvons voir que cette valeur p est de 0,00 .

Puisque cette valeur est inférieure à 0,05, nous pouvons conclure que le modèle de régression dans son ensemble est statistiquement significatif.

En d’autres termes, la combinaison des heures étudiées et des examens préparatoires passés a une relation statistiquement significative avec la note finale à l’examen.

Valeur P de la première variable prédictive (heures)

La valeur p pour la première variable prédictive, les heures, est de 0,00.

Puisque cette valeur est inférieure à 0,05, nous pouvons conclure que les heures étudiées sont statistiquement significatives.

En d’autres termes, le nombre d’heures pendant lesquelles un étudiant étudie a une relation statistiquement significative avec la note obtenue à l’examen final.

Valeur P de la deuxième variable prédictive (examens préparatoires)

La valeur p pour la deuxième variable prédictive, les examens préparatoires, est de 0,52.

Puisque cette valeur n’est pas inférieure à 0,05, nous pouvons conclure que le nombre d’examens préparatoires passés n’est pas statistiquement significatif.

En d’autres termes, le nombre d’examens préparatoires qu’un étudiant passe n’a pas de relation statistiquement significative avec la note obtenue à l’examen final.

Étant donné que cette variable n’est pas statistiquement significative, nous pouvons décider de la supprimer du modèle car elle n’apporte aucune amélioration significative au modèle global.

Dans ce cas, nous pourrions effectuer une régression linéaire simple en utilisant uniquement les heures étudiées comme variable prédictive.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans Excel :

Comment effectuer une régression linéaire simple dans Excel
Comment effectuer une régression linéaire multiple dans Excel
Comment effectuer une régression polynomiale dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *