Comment calculer les résidus standardisés dans Excel



Un résidu est la différence entre une valeur observée et une valeur prédite dans un modèle de régression .

Il est calculé comme suit :

Résiduel = Valeur observée – Valeur prédite

Si nous traçons les valeurs observées et superposons la droite de régression ajustée, les résidus pour chaque observation seraient la distance verticale entre l’observation et la droite de régression :

Exemple de résidu en statistiques

Un type de résidu que nous utilisons souvent pour identifier les valeurs aberrantes dans un modèle de régression est appelé résidu standardisé .

Il est calculé comme suit :

r je = e je / s(e je ) = e je / RSE√ 1-h ii

où:

  • e i : Le i ème résidu
  • RSE : l’erreur type résiduelle du modèle
  • h ii : Le levier de la ième observation

En pratique, on considère souvent tout résidu standardisé dont la valeur absolue est supérieure à 3 comme une valeur aberrante.

Ce didacticiel fournit un exemple étape par étape de la façon de calculer des résidus standardisés dans Excel.

Étape 1 : Saisissez les données

Tout d’abord, nous allons saisir les valeurs d’un petit ensemble de données dans Excel :

Étape 2 : Calculer les résidus

Ensuite, nous allons accéder à l’onglet Données le long du ruban supérieur et cliquer sur Analyse des données dans le groupe Analyse :

Si vous n’avez pas déjà installé ce complément, consultez ce didacticiel pour savoir comment procéder. C’est facile à installer et totalement gratuit.

Une fois que vous avez cliqué sur Analyse des données, cliquez sur l’option qui dit Régression , puis cliquez sur OK . Dans la nouvelle fenêtre qui apparaît, remplissez les informations suivantes et cliquez sur OK :

Le résidu pour chaque observation apparaîtra dans le résultat :

Résidus dans Excel

Copiez et collez ces résidus dans une nouvelle colonne à côté des données d’origine :

Étape 3 : Calculer l’effet de levier

Ensuite, nous devons calculer l’effet de levier de chaque observation.

L’image suivante montre comment procéder :

Tirer parti du calcul dans Excel pour les statistiques

Voici les formules utilisées dans les différentes cellules :

  • B14 : =COMPTE(B2 :B13)
  • B15 : = MOYENNE (B2 : B13)
  • B16 : =DEVSQ(B2:B13)
  • E2 : =1/$B$14+(B2-$B$15)^2/$B$16

Étape 4 : Calculer les résidus standardisés

Enfin, on peut calculer les résidus standardisés à l’aide de la formule :

r je = e je / RSE√ 1-h ii

Le RSE du modèle peut être trouvé dans les résultats du modèle précédent. Il s’avère que c’est 4,44 :

Ainsi, nous pouvons utiliser la formule suivante pour calculer le résidu standardisé pour chaque observation :

Résidus standardisés dans Excel

D’après les résultats, nous pouvons voir qu’aucun des résidus standardisés ne dépasse une valeur absolue de 3. Ainsi, aucune des observations ne semble être aberrante.

Il convient de noter que dans certains cas, les chercheurs considèrent comme aberrantes les observations dont les résidus standardisés dépassent une valeur absolue de 2.

C’est à vous de décider d’utiliser une valeur absolue de 2 ou 3 comme seuil pour les valeurs aberrantes, en fonction du problème spécifique sur lequel vous travaillez.

Ressources additionnelles

Que sont les résidus ?
Que sont les résidus standardisés ?
Introduction à la régression linéaire multiple

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *