R에서 잔여 표준 오차를 계산하는 방법


R에 선형 회귀 모델을 적용할 때마다 모델은 다음과 같은 형식을 취합니다.

Y = β 0 + β 1 X + … + β 나는

여기서 ϵ는 X와 무관한 오류항입니다.

X를 사용하여 Y 값을 예측할 수 있더라도 모델에는 항상 임의 오류가 있습니다. 이러한 무작위 오차의 분산을 측정하는 한 가지 방법은 잔차 ϵ의 표준편차를 측정하는 방법인 잔차 표준오차 를 사용하는 것입니다.

회귀 모델의 잔차 표준 오차는 다음과 같이 계산됩니다.

잔차 표준 오차 = √ SS 잔차 / df 잔차

금:

  • 잔차 SS : 잔차 제곱합입니다.
  • 잔차 df : 잔차 자유도, n – k – 1로 계산됩니다. 여기서 n = 총 관측치 수이고 k = 총 모델 매개변수 수입니다.

R에서 회귀 모델의 잔차 표준 오차를 계산하는 데 사용할 수 있는 세 가지 방법이 있습니다.

방법 1: 모델 요약 분석

잔차 표준 오차를 얻는 첫 번째 방법은 단순히 선형 회귀 모델을 적합시킨 다음 summary() 명령을 사용하여 모델 결과를 얻는 것입니다. 그런 다음 출력 하단에서 “잔류 표준 오류”를 찾으십시오.

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

잔차 표준오차는 3.127 임을 알 수 있습니다.

방법 2: 간단한 수식 사용

잔차 표준 오차(RSE)를 구하는 또 다른 방법은 선형 회귀 모델을 적합시킨 후 다음 공식을 사용하여 RSE를 계산하는 것입니다.

 sqrt( deviance (model)/df. residual (model))

R에서 이 공식을 구현하는 방법은 다음과 같습니다.

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

잔차 표준오차는 3.126601 임을 알 수 있습니다.

방법 3: 단계별 공식 사용

잔차 표준 오차를 얻는 또 다른 방법은 선형 회귀 모델을 적합시킨 다음 단계별 접근 방식을 사용하여 RSE 공식의 각 개별 구성 요소를 계산하는 것입니다.

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

잔차 표준오차는 3.126601 임을 알 수 있습니다.

잔차 표준 오차를 해석하는 방법

앞서 언급했듯이 잔차 표준 오차(RSE)는 회귀 모델에서 잔차의 표준 편차를 측정하는 방법입니다.

CSR 값이 낮을수록 모델이 데이터에 더 잘 맞는다는 뜻입니다(그러나 과적합 에 주의하세요). 이는 두 개 이상의 모델을 비교하여 데이터에 가장 적합한 모델을 결정할 때 사용하는 유용한 측정항목이 될 수 있습니다.

추가 리소스

잔차 표준 오차를 해석하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 모델 성능을 교차 검증하는 방법
R에서 표준편차를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다