Comment extraire RMSE de la fonction lm() dans R



Vous pouvez utiliser la syntaxe suivante pour extraire l’ erreur quadratique moyenne (RMSE) de la fonction lm() dans R :

sqrt(mean(model$residuals^2))

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Connexes : Comment interpréter l’erreur quadratique moyenne (RMSE)

Exemple : Extraire RMSE de lm() dans R

Supposons que nous ajustions le modèle de régression linéaire multiple suivant dans R :

#create data frame
df <- data.frame(rating=c(67, 75, 79, 85, 90, 96, 97),
                 points=c(8, 12, 16, 15, 22, 28, 24),
                 assists=c(4, 6, 6, 5, 3, 8, 7),
                 rebounds=c(1, 4, 3, 3, 2, 6, 7))

#fit multiple linear regression model
model <- lm(rating ~ points + assists + rebounds, data=df)

Nous pouvons utiliser la fonction summary() pour afficher le résumé complet du modèle de régression :

#view model summary
summary(model)

Call:
lm(formula = rating ~ points + assists + rebounds, data = df)

Residuals:
      1       2       3       4       5       6       7 
-1.5902 -1.7181  0.2413  4.8597 -1.0201 -0.6082 -0.1644 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  66.4355     6.6932   9.926  0.00218 **
points        1.2152     0.2788   4.359  0.02232 * 
assists      -2.5968     1.6263  -1.597  0.20860   
rebounds      2.8202     1.6118   1.750  0.17847   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared:  0.9589,	Adjusted R-squared:  0.9179 
F-statistic: 23.35 on 3 and 3 DF,  p-value: 0.01396

Pour extraire uniquement l’erreur quadratique moyenne (RMSE) du modèle, nous pouvons utiliser la syntaxe suivante :

#extract RMSE of regression model
sqrt(mean(model$residuals^2))

[1] 2.090564

Le RMSE du modèle est 2,090564 .

Cela représente la distance moyenne entre les valeurs prédites du modèle et les valeurs réelles de l’ensemble de données.

Notez que plus le RMSE est bas, plus un modèle donné est capable de « s’adapter » à un ensemble de données.

Lorsque l’on compare plusieurs modèles de régression différents, le modèle avec le RMSE le plus bas est considéré comme celui qui « correspond » le mieux à l’ensemble de données.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment créer un tracé résiduel dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *