Comment créer un tracé résiduel dans R



Les tracés des résidus sont souvent utilisés pour évaluer si les résidus d’une analyse de régression sont normalement distribués et s’ils présentent ou non une hétéroscédasticité .

Ce didacticiel explique comment créer des tracés résiduels pour un modèle de régression dans R.

Exemple : tracés résiduels dans R

Dans cet exemple, nous allons ajuster un modèle de régression à l’aide de l’ensemble de données R intégré mtcars , puis produire trois tracés de résidus différents pour analyser les résidus.

Étape 1 : Ajuster le modèle de régression.

Tout d’abord, nous ajusterons un modèle de régression en utilisant mpg comme variable de réponse et disp et hp comme variables explicatives :

#load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Étape 2 : Produire un tracé résiduel ou ajusté.

Ensuite, nous produirons un graphique résiduel/ajusté, utile pour détecter visuellement l’hétéroscédasticité – par exemple un changement systématique dans la répartition des résidus sur une plage de valeurs.

#produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Terrain résiduel ou ajusté dans R

L’axe des x affiche les valeurs ajustées et l’axe des y affiche les résidus. Sur le graphique, nous pouvons voir que la répartition des résidus a tendance à être plus élevée pour des valeurs ajustées plus élevées, mais cela ne semble pas suffisamment grave pour que nous devions apporter des modifications au modèle.

Étape 3 : Produisez un tracé QQ.

Nous pouvons également produire un tracé QQ, utile pour déterminer si les résidus suivent une distribution normale. Si les valeurs des données dans le tracé suivent une ligne à peu près droite à un angle de 45 degrés, alors les données sont normalement distribuées.

#create Q-Q plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Tracé résiduel Q-Q dans R

Nous pouvons voir que les résidus ont tendance à s’écarter un peu de la ligne près des queues, ce qui pourrait indiquer qu’ils ne sont pas normalement distribués.

Étape 4 : Produisez un tracé de densité.

Nous pouvons également produire un tracé de densité, qui est également utile pour vérifier visuellement si les résidus sont normalement distribués ou non. Si le tracé est à peu près en forme de cloche, les résidus suivent probablement une distribution normale.

#Create density plot of residuals
plot(density(res))

Courbe de densité résiduelle dans R

Nous pouvons voir que le tracé de densité suit à peu près une forme de cloche, bien qu’il soit légèrement incliné vers la droite. Selon le type d’étude, un chercheur peut décider ou non d’effectuer une transformation sur les données pour s’assurer que les résidus sont distribués plus normalement.

Ressources additionnelles

Comment calculer les résidus standardisés dans R
Comment calculer les résidus studentisés dans R
Comment créer un histogramme de résidus dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *