Jak obliczyć resztkowy błąd standardowy w r
Ilekroć dopasowujemy model regresji liniowej w R, model przyjmuje następującą postać:
Y = β 0 + β 1 X + … + β ja
gdzie ϵ jest składnikiem błędu niezależnym od X.
Bez względu na to, jak X można wykorzystać do przewidzenia wartości Y, w modelu zawsze wystąpi błąd losowy. Jednym ze sposobów pomiaru rozproszenia tego błędu losowego jest użycie resztowego błędu standardowego , który jest sposobem pomiaru odchylenia standardowego reszt ϵ.
Resztkowy błąd standardowy modelu regresji oblicza się w następujący sposób:
Resztkowy błąd standardowy = √ reszt SS / reszt df
Złoto:
- Reszty SS : Resztowa suma kwadratów.
- reszta df : resztkowe stopnie swobody, obliczane jako n – k – 1 gdzie n = całkowita liczba obserwacji i k = całkowita liczba parametrów modelu.
Istnieją trzy metody, których możemy użyć do obliczenia resztowego błędu standardowego modelu regresji w R.
Metoda 1: Przeanalizuj podsumowanie modelu
Pierwszym sposobem uzyskania resztowego błędu standardowego jest po prostu dopasowanie modelu regresji liniowej, a następnie użycie polecenia podsumowanie() w celu uzyskania wyników modelu. Następnie poszukaj „resztkowego błędu standardowego” na dole danych wyjściowych:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Widzimy, że resztkowy błąd standardowy wynosi 3,127 .
Metoda 2: Użyj prostej formuły
Innym sposobem uzyskania resztowego błędu standardowego (RSE) jest dopasowanie modelu regresji liniowej, a następnie użycie następującego wzoru do obliczenia RSE:
sqrt( deviance (model)/df. residual (model))
Oto jak zaimplementować tę formułę w R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Widzimy, że resztkowy błąd standardowy wynosi 3,126601 .
Metoda 3: Użyj formuły krok po kroku
Innym sposobem uzyskania resztowego błędu standardowego jest dopasowanie modelu regresji liniowej, a następnie zastosowanie podejścia krok po kroku do obliczenia każdego pojedynczego składnika wzoru RSE:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Widzimy, że resztkowy błąd standardowy wynosi 3,126601 .
Jak interpretować resztkowy błąd standardowy
Jak wspomniano wcześniej, błąd standardowy reszt (RSE) to sposób pomiaru odchylenia standardowego reszt w modelu regresji.
Im niższa wartość CSR, tym lepiej model jest w stanie dopasować dane (należy jednak uważać na nadmierne dopasowanie ). Może to być przydatna metryka do wykorzystania podczas porównywania dwóch lub więcej modeli w celu ustalenia, który model najlepiej pasuje do danych.
Dodatkowe zasoby
Jak interpretować resztkowy błąd standardowy
Jak wykonać wielokrotną regresję liniową w R
Jak zweryfikować krzyżowo wydajność modelu w R
Jak obliczyć odchylenie standardowe w R