Comment calculer les résidus standardisés dans Excel
Un résidu est la différence entre une valeur observée et une valeur prédite dans un modèle de régression .
Il est calculé comme suit :
Résiduel = Valeur observée – Valeur prédite
Si nous traçons les valeurs observées et superposons la droite de régression ajustée, les résidus pour chaque observation seraient la distance verticale entre l’observation et la droite de régression :
Un type de résidu que nous utilisons souvent pour identifier les valeurs aberrantes dans un modèle de régression est appelé résidu standardisé .
Il est calculé comme suit :
r je = e je / s(e je ) = e je / RSE√ 1-h ii
où:
- e i : Le i ème résidu
- RSE : l’erreur type résiduelle du modèle
- h ii : Le levier de la ième observation
En pratique, on considère souvent tout résidu standardisé dont la valeur absolue est supérieure à 3 comme une valeur aberrante.
Ce didacticiel fournit un exemple étape par étape de la façon de calculer des résidus standardisés dans Excel.
Étape 1 : Saisissez les données
Tout d’abord, nous allons saisir les valeurs d’un petit ensemble de données dans Excel :
Étape 2 : Calculer les résidus
Ensuite, nous allons accéder à l’onglet Données le long du ruban supérieur et cliquer sur Analyse des données dans le groupe Analyse :
Si vous n’avez pas déjà installé ce complément, consultez ce didacticiel pour savoir comment procéder. C’est facile à installer et totalement gratuit.
Une fois que vous avez cliqué sur Analyse des données, cliquez sur l’option qui dit Régression , puis cliquez sur OK . Dans la nouvelle fenêtre qui apparaît, remplissez les informations suivantes et cliquez sur OK :
Le résidu pour chaque observation apparaîtra dans le résultat :
Copiez et collez ces résidus dans une nouvelle colonne à côté des données d’origine :
Étape 3 : Calculer l’effet de levier
Ensuite, nous devons calculer l’effet de levier de chaque observation.
L’image suivante montre comment procéder :
Voici les formules utilisées dans les différentes cellules :
- B14 : =COMPTE(B2 :B13)
- B15 : = MOYENNE (B2 : B13)
- B16 : =DEVSQ(B2:B13)
- E2 : =1/$B$14+(B2-$B$15)^2/$B$16
Étape 4 : Calculer les résidus standardisés
Enfin, on peut calculer les résidus standardisés à l’aide de la formule :
r je = e je / RSE√ 1-h ii
Le RSE du modèle peut être trouvé dans les résultats du modèle précédent. Il s’avère que c’est 4,44 :
Ainsi, nous pouvons utiliser la formule suivante pour calculer le résidu standardisé pour chaque observation :
D’après les résultats, nous pouvons voir qu’aucun des résidus standardisés ne dépasse une valeur absolue de 3. Ainsi, aucune des observations ne semble être aberrante.
Il convient de noter que dans certains cas, les chercheurs considèrent comme aberrantes les observations dont les résidus standardisés dépassent une valeur absolue de 2.
C’est à vous de décider d’utiliser une valeur absolue de 2 ou 3 comme seuil pour les valeurs aberrantes, en fonction du problème spécifique sur lequel vous travaillez.
Ressources additionnelles
Que sont les résidus ?
Que sont les résidus standardisés ?
Introduction à la régression linéaire multiple