Как рассчитать остаточную стандартную ошибку в r


Всякий раз, когда мы подгоняем модель линейной регрессии в R, она принимает следующую форму:

Y = β 0 + β 1 X + … + β я

где ϵ — член ошибки, не зависящий от X.

Независимо от того, как X можно использовать для прогнозирования значений Y, в модели всегда будет случайная ошибка. Одним из способов измерения дисперсии этой случайной ошибки является использование остаточной стандартной ошибки , которая является способом измерения стандартного отклонения остатков ϵ.

Остаточная стандартная ошибка регрессионной модели рассчитывается следующим образом:

Остаточная стандартная ошибка = √ остатки SS / остатки df

Золото:

  • Остатки SS : Остаточная сумма квадратов.
  • остаточная df : остаточные степени свободы, рассчитываемые как n – k – 1, где n = общее количество наблюдений и k = общее количество параметров модели.

Существует три метода, которые мы можем использовать для расчета остаточной стандартной ошибки регрессионной модели в R.

Метод 1: Анализ сводной информации о модели

Первый способ получить остаточную стандартную ошибку — просто подобрать модель линейной регрессии, а затем использовать команду summary() для получения результатов модели. Затем просто найдите «остаточную стандартную ошибку» внизу вывода:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Мы видим, что остаточная стандартная ошибка равна 3,127 .

Метод 2: используйте простую формулу

Другой способ получить остаточную стандартную ошибку (RSE) — подобрать модель линейной регрессии, а затем использовать следующую формулу для расчета RSE:

 sqrt( deviance (model)/df. residual (model))

Вот как реализовать эту формулу в R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Мы видим, что остаточная стандартная ошибка равна 3,126601 .

Способ 3: используйте пошаговую формулу

Другой способ получить остаточную стандартную ошибку — подобрать модель линейной регрессии, а затем использовать пошаговый подход для расчета каждого отдельного компонента формулы RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Мы видим, что остаточная стандартная ошибка равна 3,126601 .

Как интерпретировать остаточную стандартную ошибку

Как упоминалось ранее, остаточная стандартная ошибка (RSE) — это способ измерения стандартного отклонения остатков в регрессионной модели.

Чем ниже значение CSR, тем лучше модель может соответствовать данным (но будьте осторожны с переобучением ). Это может быть полезным показателем, который можно использовать при сравнении двух или более моделей, чтобы определить, какая модель лучше всего соответствует данным.

Дополнительные ресурсы

Как интерпретировать остаточную стандартную ошибку
Как выполнить множественную линейную регрессию в R
Как перекрестно проверить производительность модели в R
Как рассчитать стандартное отклонение в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *