Як отримати rmse із функції lm() у r


Щоб отримати середню квадратичну помилку (RMSE) функції lm() у R, можна використати такий синтаксис:

 sqrt(mean(model$residuals^2))

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Пов’язане: Як інтерпретувати середньоквадратичну помилку (RMSE)

Приклад: витягти RMSE з lm() у R

Припустімо, що ми використовуємо таку модель множинної лінійної регресії в R:

 #create data frame
df <- data. frame (rating=c(67, 75, 79, 85, 90, 96, 97),
                 points=c(8, 12, 16, 15, 22, 28, 24),
                 assists=c(4, 6, 6, 5, 3, 8, 7),
                 rebounds=c(1, 4, 3, 3, 2, 6, 7))

#fit multiple linear regression model
model <- lm(rating ~ points + assists + rebounds, data=df)

Ми можемо використовувати функцію summary() для відображення повного підсумку регресійної моделі:

 #view model summary
summary(model)

Call:
lm(formula = rating ~ points + assists + rebounds, data = df)

Residuals:
      1 2 3 4 5 6 7 
-1.5902 -1.7181 0.2413 4.8597 -1.0201 -0.6082 -0.1644 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) 66.4355 6.6932 9.926 0.00218 **
points 1.2152 0.2788 4.359 0.02232 * 
assists -2.5968 1.6263 -1.597 0.20860   
rebounds 2.8202 1.6118 1.750 0.17847   
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared: 0.9589, Adjusted R-squared: 0.9179 
F-statistic: 23.35 on 3 and 3 DF, p-value: 0.01396

Щоб отримати лише середню квадратичну помилку (RMSE) моделі, ми можемо використати такий синтаксис:

 #extract RMSE of regression model
sqrt(mean(model$residuals^2))

[1] 2.090564

RMSE моделі становить 2,090564 .

Це являє собою середню відстань між прогнозованими значеннями моделі та фактичними значеннями набору даних.

Зауважте, що чим нижче RMSE, тим краще дана модель здатна «відповідати» набору даних.

Під час порівняння кількох різних регресійних моделей модель з найнижчим середньоквадратичним значенням вважається тією, яка найкраще «відповідає» набору даних.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R
Як створити ділянку залишків у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *