잔차 표준 오차를 해석하는 방법
잔차 표준 오차는 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 측정하는 데 사용됩니다.
간단히 말해서 회귀 모델에서 잔차의 표준 편차를 측정합니다.
다음과 같이 계산됩니다.
잔여 표준 오차 = √ Σ(y – ŷ) 2 /df
금:
- y: 관찰된 값
- ŷ: 예측값
- df: 총 관찰 수 – 총 모델 매개변수 수로 계산된 자유도입니다.
잔차 표준 오차가 작을수록 회귀 모델이 데이터 세트에 더 잘 맞는 것입니다. 반대로, 잔차 표준 오차가 높을수록 회귀 모델이 데이터 세트에 더 적합하지 않습니다.
작은 잔여 표준 오차가 있는 회귀 모델은 적합 회귀선 주위에 데이터 포인트가 밀집되어 있습니다.

이 모델의 잔차 (관측값과 예측값의 차이)는 작을 것이며 이는 잔차 표준 오차도 작다는 것을 의미합니다.
반대로, 잔차 표준 오차가 큰 회귀 모델은 적합 회귀선 주위에 데이터 포인트가 더 느슨하게 분산되어 있습니다.

이 모델의 잔차는 더 커집니다. 이는 잔차 표준 오차도 더 커진다는 것을 의미합니다.
다음 예에서는 R에서 회귀 모델의 잔차 표준 오차를 계산하고 해석하는 방법을 보여줍니다.
예: 잔차 표준 오차 해석
다음과 같은 다중 선형 회귀 모델을 적합화한다고 가정합니다.
mpg = β 0 + β 1 (변위) + β 2 (전력)
이 모델은 예측 변수 “변위”와 “마력”을 사용하여 특정 자동차가 이동하는 갤런당 마일을 예측합니다.
다음 코드는 R에서 이 회귀 모델을 맞추는 방법을 보여줍니다.
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
결과 하단을 보면 이 모델의 잔차 표준 오차가 3.127 임을 알 수 있습니다.
이는 회귀 모델이 약 3,127의 평균 오류로 자동차 mpg를 예측한다는 것을 알려줍니다.
잔차 표준 오차를 사용하여 모델 비교
잔차 표준 오차는 다양한 회귀 모델의 적합성을 비교하는 데 특히 유용합니다.
예를 들어, 자동차 연비를 예측하기 위해 두 가지 다른 회귀 모델을 적용한다고 가정합니다. 각 모형의 잔차 표준오차는 다음과 같습니다.
- 모델 1의 잔여 표준 오차: 3.127
- 모델 2의 잔여 표준 오차: 5.657
모델 1은 잔차 표준 오차가 낮기 때문에 모델 2보다 데이터에 더 잘 맞습니다. 따라서 우리는 모델 1을 사용하여 자동차 mpg를 예측하는 것을 선호합니다. 그 이유는 모델 1의 예측이 자동차의 관측된 mpg 값에 더 가깝기 때문입니다.
추가 리소스
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 잔차 플롯을 만드는 방법