잔차 표준 오차를 해석하는 방법

에 의해 벤자민 앤더슨 7월 25, 2023 가이드 댓글 0개

잔차 표준 오차는 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 측정하는 데 사용됩니다.

간단히 말해서 회귀 모델에서 잔차의 표준 편차를 측정합니다.

다음과 같이 계산됩니다.

잔여 표준 오차 = √ Σ(y – ŷ) ² /df

금:

y: 관찰된 값
ŷ: 예측값
df: 총 관찰 수 – 총 모델 매개변수 수로 계산된 자유도입니다.

잔차 표준 오차가 작을수록 회귀 모델이 데이터 세트에 더 잘 맞는 것입니다. 반대로, 잔차 표준 오차가 높을수록 회귀 모델이 데이터 세트에 더 적합하지 않습니다.

작은 잔여 표준 오차가 있는 회귀 모델은 적합 회귀선 주위에 데이터 포인트가 밀집되어 있습니다.

이 모델의 잔차 (관측값과 예측값의 차이)는 작을 것이며 이는 잔차 표준 오차도 작다는 것을 의미합니다.

반대로, 잔차 표준 오차가 큰 회귀 모델은 적합 회귀선 주위에 데이터 포인트가 더 느슨하게 분산되어 있습니다.

이 모델의 잔차는 더 커집니다. 이는 잔차 표준 오차도 더 커진다는 것을 의미합니다.

다음 예에서는 R에서 회귀 모델의 잔차 표준 오차를 계산하고 해석하는 방법을 보여줍니다.

예: 잔차 표준 오차 해석

다음과 같은 다중 선형 회귀 모델을 적합화한다고 가정합니다.

mpg = β ₀ + β ₁ (변위) + β ₂ (전력)

이 모델은 예측 변수 “변위”와 “마력”을 사용하여 특정 자동차가 이동하는 갤런당 마일을 예측합니다.

다음 코드는 R에서 이 회귀 모델을 맞추는 방법을 보여줍니다.

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

결과 하단을 보면 이 모델의 잔차 표준 오차가 3.127 임을 알 수 있습니다.

이는 회귀 모델이 약 3,127의 평균 오류로 자동차 mpg를 예측한다는 것을 알려줍니다.

잔차 표준 오차를 사용하여 모델 비교

잔차 표준 오차는 다양한 회귀 모델의 적합성을 비교하는 데 특히 유용합니다.

예를 들어, 자동차 연비를 예측하기 위해 두 가지 다른 회귀 모델을 적용한다고 가정합니다. 각 모형의 잔차 표준오차는 다음과 같습니다.

모델 1의 잔여 표준 오차: 3.127
모델 2의 잔여 표준 오차: 5.657

모델 1은 잔차 표준 오차가 낮기 때문에 모델 2보다 데이터에 더 잘 맞습니다. 따라서 우리는 모델 1을 사용하여 자동차 mpg를 예측하는 것을 선호합니다. 그 이유는 모델 1의 예측이 자동차의 관측된 mpg 값에 더 가깝기 때문입니다.

추가 리소스

R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 잔차 플롯을 만드는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: 잔차 표준 오차 해석

잔차 표준 오차를 사용하여 모델 비교

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다