Comment calculer l’erreur type résiduelle dans R



Chaque fois que nous ajustons un modèle de régression linéaire dans R, le modèle prend la forme suivante :

Y = β 0 + β 1 X + … + β je X +ϵ

où ϵ est un terme d’erreur indépendant de X.

Quelle que soit la manière dont X peut être utilisé pour prédire les valeurs de Y, il y aura toujours une erreur aléatoire dans le modèle. Une façon de mesurer la dispersion de cette erreur aléatoire consiste à utiliser l’ erreur type résiduelle , qui est un moyen de mesurer l’écart type des résidus ϵ.

L’erreur type résiduelle d’un modèle de régression est calculée comme suit :

Erreur type résiduelle = √ résidus SS / résidus df

où:

  • Résidus SS : La somme résiduelle des carrés.
  • df résiduels : degrés de liberté résiduels, calculés comme n – k – 1 où n = nombre total d’observations et k = nombre total de paramètres du modèle.

Il existe trois méthodes que nous pouvons utiliser pour calculer l’erreur type résiduelle d’un modèle de régression dans R.

Méthode 1 : analyser le résumé du modèle

La première façon d’obtenir l’erreur type résiduelle consiste simplement à ajuster un modèle de régression linéaire, puis à utiliser la commande summary() pour obtenir les résultats du modèle. Ensuite, recherchez simplement « erreur standard résiduelle » en bas de la sortie :

#load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.7945 -2.3036 -0.8246  1.8582  6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904   1.331566  23.083  < 2e-16 ***
disp        -0.030346   0.007405  -4.098 0.000306 ***
hp          -0.024840   0.013385  -1.856 0.073679 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared:  0.7482,	Adjusted R-squared:  0.7309 
F-statistic: 43.09 on 2 and 29 DF,  p-value: 2.062e-09

Nous pouvons voir que l’erreur type résiduelle est de 3,127 .

Méthode 2 : utilisez une formule simple

Une autre façon d’obtenir l’erreur type résiduelle (RSE) consiste à ajuster un modèle de régression linéaire, puis à utiliser la formule suivante pour calculer la RSE :

sqrt(deviance(model)/df.residual(model))

Voici comment implémenter cette formule dans R :

#load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt(deviance(model)/df.residual(model))

[1] 3.126601

Nous pouvons voir que l’erreur type résiduelle est de 3,126601 .

Méthode 3 : utilisez une formule étape par étape

Une autre façon d’obtenir l’erreur type résiduelle consiste à ajuster un modèle de régression linéaire, puis à utiliser une approche étape par étape pour calculer chaque composante individuelle de la formule du RSE :

#load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$coefficients)-1

#calculate sum of squared residuals
SSE=sum(model$residuals**2)

#calculate total observations in dataset
n=length(model$residuals)

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Nous pouvons voir que l’erreur type résiduelle est de 3,126601 .

Comment interpréter l’erreur type résiduelle

Comme mentionné précédemment, l’erreur type résiduelle (RSE) est un moyen de mesurer l’écart type des résidus dans un modèle de régression.

Plus la valeur de RSE est faible, plus un modèle est capable de s’adapter aux données (mais faites attention au surajustement ). Cela peut être une mesure utile à utiliser lors de la comparaison de deux modèles ou plus afin de déterminer quel modèle correspond le mieux aux données.

Ressources additionnelles

Comment interpréter l’erreur standard résiduelle
Comment effectuer une régression linéaire multiple dans R
Comment effectuer une validation croisée pour les performances du modèle dans R
Comment calculer l’écart type dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *