Comment effectuer une régression linéaire simple dans Excel



La régression linéaire simple est une méthode que nous pouvons utiliser pour comprendre la relation entre une variable explicative, x, et une variable de réponse, y.

Ce didacticiel explique comment effectuer une régression linéaire simple dans Excel.

Exemple : régression linéaire simple dans Excel

Supposons que nous souhaitions comprendre la relation entre le nombre d’heures qu’un étudiant étudie pour un examen et la note qu’il obtient à l’examen.

Pour explorer cette relation, nous pouvons effectuer une régression linéaire simple en utilisant les heures étudiées comme variable explicative et les résultats à l’examen comme variable de réponse.

Effectuez les étapes suivantes dans Excel pour effectuer une régression linéaire simple.

Étape 1 : Saisissez les données.

Saisissez les données suivantes pour le nombre d’heures étudiées et la note d’examen obtenue pour 20 étudiants :

Données brutes dans Excel

Étape 2 : Visualisez les données.

Avant d’effectuer une régression linéaire simple, il est utile de créer un nuage de points des données pour s’assurer qu’il existe réellement une relation linéaire entre les heures étudiées et la note de l’examen.

Mettez en surbrillance les données dans les colonnes A et B. Le long du ruban supérieur d’Excel, accédez à l’onglet Insertion . Dans le groupe Graphiques , cliquez sur Insérer un nuage de points (X, Y) et cliquez sur la première option intitulée Scatter . Cela produira automatiquement le nuage de points suivant :

Nuage de points dans Excel

Le nombre d’heures étudiées est indiqué sur l’axe des x et les résultats des examens sont indiqués sur l’axe des y. Nous pouvons voir qu’il existe une relation linéaire entre les deux variables : plus d’heures d’études sont associées à des résultats aux examens plus élevés.

Pour quantifier la relation entre ces deux variables, nous pouvons effectuer une régression linéaire simple.

Étape 3 : Effectuez une régression linéaire simple.

Dans le ruban supérieur d’Excel, accédez à l’onglet Données et cliquez sur Analyse des données . Si vous ne voyez pas cette option, vous devez d’abord installer le logiciel gratuit Analysis ToolPak .

Option d'analyse de données dans Excel

Une fois que vous avez cliqué sur Analyse des données, une nouvelle fenêtre apparaîtra. Sélectionnez Régression et cliquez sur OK.

Option de régression dans Excel Data Analysis Toolpak

Pour Input Y Range , remplissez le tableau de valeurs pour la variable de réponse. Pour Input X Range , remplissez le tableau de valeurs pour la variable explicative.

Cochez la case à côté de Étiquettes pour qu’Excel sache que nous avons inclus les noms de variables dans les plages d’entrée.

Pour Plage de sortie , sélectionnez une cellule dans laquelle vous souhaitez que la sortie de la régression apparaisse.

Cliquez ensuite sur OK .

Régression dans Excel

La sortie suivante apparaîtra automatiquement :

Sortie de régression linéaire simple dans Excel

Étape 4 : Interprétez le résultat.

Voici comment interpréter les nombres les plus pertinents dans le résultat :

R Carré : 0,7273 . C’est ce qu’on appelle le coefficient de détermination. C’est la proportion de la variance de la variable de réponse qui peut être expliquée par la variable explicative. Dans cet exemple, 72,73 % de la variation des résultats aux examens s’explique par le nombre d’heures étudiées.

Erreur type : 5,2805 . Il s’agit de la distance moyenne entre les valeurs observées et la droite de régression. Dans cet exemple, les valeurs observées s’éloignent en moyenne de 5,2805 unités de la droite de régression.

F : 47.9952 . Il s’agit de la statistique F globale pour le modèle de régression, calculée comme MS de régression / MS résiduelle.

Signification F : 0,0000 . Il s’agit de la valeur p associée à la statistique F globale. Cela nous indique si le modèle de régression est statistiquement significatif ou non. En d’autres termes, cela nous indique si la variable explicative a une association statistiquement significative avec la variable de réponse. Dans ce cas, la valeur p est inférieure à 0,05, ce qui indique qu’il existe une association statistiquement significative entre les heures étudiées et la note obtenue à l’examen.

Coefficients : Les coefficients nous donnent les nombres nécessaires pour écrire l’équation de régression estimée. Dans cet exemple, l’équation de régression estimée est :

score à l’examen = 67,16 + 5,2503*(heures)

Nous interprétons le coefficient des heures comme signifiant que pour chaque heure supplémentaire étudiée, la note à l’examen devrait augmenter de 5,2503 en moyenne. Nous interprétons le coefficient de l’interception comme signifiant que la note attendue à l’examen pour un étudiant qui étudie zéro heure est de 67,16 .

Nous pouvons utiliser cette équation de régression estimée pour calculer la note attendue à l’examen pour un étudiant, en fonction du nombre d’heures d’études.

Par exemple, un étudiant qui étudie pendant trois heures devrait obtenir une note à l’examen de 82,91 :

note à l’examen = 67,16 + 5,2503*(3) = 82,91

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans Excel :

Comment créer un tracé résiduel dans Excel
Comment construire un intervalle de prédiction dans Excel
Comment créer un tracé QQ dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *