Jak obliczyć resztkowy błąd standardowy w r


Ilekroć dopasowujemy model regresji liniowej w R, model przyjmuje następującą postać:

Y = β 0 + β 1 X + … + β ja

gdzie ϵ jest składnikiem błędu niezależnym od X.

Bez względu na to, jak X można wykorzystać do przewidzenia wartości Y, w modelu zawsze wystąpi błąd losowy. Jednym ze sposobów pomiaru rozproszenia tego błędu losowego jest użycie resztowego błędu standardowego , który jest sposobem pomiaru odchylenia standardowego reszt ϵ.

Resztkowy błąd standardowy modelu regresji oblicza się w następujący sposób:

Resztkowy błąd standardowy = √ reszt SS / reszt df

Złoto:

  • Reszty SS : Resztowa suma kwadratów.
  • reszta df : resztkowe stopnie swobody, obliczane jako n – k – 1 gdzie n = całkowita liczba obserwacji i k = całkowita liczba parametrów modelu.

Istnieją trzy metody, których możemy użyć do obliczenia resztowego błędu standardowego modelu regresji w R.

Metoda 1: Przeanalizuj podsumowanie modelu

Pierwszym sposobem uzyskania resztowego błędu standardowego jest po prostu dopasowanie modelu regresji liniowej, a następnie użycie polecenia podsumowanie() w celu uzyskania wyników modelu. Następnie poszukaj „resztkowego błędu standardowego” na dole danych wyjściowych:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Widzimy, że resztkowy błąd standardowy wynosi 3,127 .

Metoda 2: Użyj prostej formuły

Innym sposobem uzyskania resztowego błędu standardowego (RSE) jest dopasowanie modelu regresji liniowej, a następnie użycie następującego wzoru do obliczenia RSE:

 sqrt( deviance (model)/df. residual (model))

Oto jak zaimplementować tę formułę w R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Widzimy, że resztkowy błąd standardowy wynosi 3,126601 .

Metoda 3: Użyj formuły krok po kroku

Innym sposobem uzyskania resztowego błędu standardowego jest dopasowanie modelu regresji liniowej, a następnie zastosowanie podejścia krok po kroku do obliczenia każdego pojedynczego składnika wzoru RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Widzimy, że resztkowy błąd standardowy wynosi 3,126601 .

Jak interpretować resztkowy błąd standardowy

Jak wspomniano wcześniej, błąd standardowy reszt (RSE) to sposób pomiaru odchylenia standardowego reszt w modelu regresji.

Im niższa wartość CSR, tym lepiej model jest w stanie dopasować dane (należy jednak uważać na nadmierne dopasowanie ). Może to być przydatna metryka do wykorzystania podczas porównywania dwóch lub więcej modeli w celu ustalenia, który model najlepiej pasuje do danych.

Dodatkowe zasoby

Jak interpretować resztkowy błąd standardowy
Jak wykonać wielokrotną regresję liniową w R
Jak zweryfikować krzyżowo wydajność modelu w R
Jak obliczyć odchylenie standardowe w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *