Qu’est-ce qu’un graphique résiduels/effet de levier ? (Définition & #038; Exemple)



Un graphique des résidus par rapport à l’effet de levier est un type de graphique de diagnostic qui nous permet d’identifier les observations influentes dans un modèle de régression.

Voici comment ce type de tracé apparaît dans le langage de programmation statistique R :

Chaque observation de l’ensemble de données est affichée sous la forme d’un point unique dans le tracé. L’axe des x montre l’effet de levier de chaque point et l’axe des y montre le résidu standardisé de chaque point.

L’effet de levier fait référence à la mesure dans laquelle les coefficients du modèle de régression changeraient si une observation particulière était supprimée de l’ensemble de données.

Les observations avec un effet de levier élevé ont une forte influence sur les coefficients du modèle de régression. Si l’on supprime ces observations, les coefficients du modèle changeraient sensiblement.

Les résidus standardisés font référence à la différence standardisée entre une valeur prédite pour une observation et la valeur réelle de l’observation.

Il convient de noter qu’une observation peut avoir une valeur absolue élevée pour un résidu standardisé, mais une faible valeur pour l’effet de levier.

Comment interpréter un graphique des résidus par rapport à l’effet de levier

Si un point de ce graphique se situe en dehors de la distance de Cook (les lignes pointillées rouges), alors il est considéré comme une observation influente.

Faisons référence au graphique des résidus par rapport à l’effet de levier présenté plus tôt :

Dans l’exemple ci-dessus, nous pouvons voir que l’observation n°10 se trouve la plus proche de la limite de la distance de Cook, mais elle ne sort pas de la ligne pointillée. Cela signifie qu’il n’y a aucun point influent dans notre modèle de régression.

Cependant, supposons que nous ayons le graphique résiduel/effet de levier suivant :

Nous pouvons voir que l’observation n°1 dans le coin supérieur droit se situe en dehors des lignes pointillées rouges. Cela indique qu’il s’agit d’un point d’influence .

Cela signifie que si nous supprimions cette observation de notre ensemble de données et ajustions à nouveau le modèle de régression, les coefficients du modèle changeraient de manière significative.

Comment gérer les observations influentes

Si vous créez un graphique des résidus par rapport à l’effet de levier pour un modèle et que vous constatez qu’une ou plusieurs observations sont identifiées comme influentes, vous pouvez effectuer plusieurs opérations :

1. Vérifiez que l’observation n’est pas une erreur.

Avant d’entreprendre toute action, vous devez d’abord vérifier que les observations influentes ne sont pas le résultat d’une erreur de saisie de données ou d’un autre événement étrange.

2. Essayez d’ajuster un autre modèle de régression.

Des observations influentes peuvent indiquer que le modèle que vous avez spécifié ne correspond pas bien aux données. Dans ce cas, vous pouvez essayer un modèle de régression polynomiale ou un modèle non linéaire.

3. Supprimez les observations influentes.

Enfin, vous pouvez décider de simplement supprimer les observations influentes si le modèle que vous avez spécifié semble bien correspondre aux données, à l’exception d’une ou deux observations influentes.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur la façon d’utiliser les résidus pour évaluer l’ajustement des modèles de régression.

Que sont les résidus dans les statistiques ?
Que sont les résidus standardisés ?
Comment interpréter les tracés de diagnostic dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *