R에서 잔여 표준 오차를 계산하는 방법
R에 선형 회귀 모델을 적용할 때마다 모델은 다음과 같은 형식을 취합니다.
Y = β 0 + β 1 X + … + β 나는
여기서 ϵ는 X와 무관한 오류항입니다.
X를 사용하여 Y 값을 예측할 수 있더라도 모델에는 항상 임의 오류가 있습니다. 이러한 무작위 오차의 분산을 측정하는 한 가지 방법은 잔차 ϵ의 표준편차를 측정하는 방법인 잔차 표준오차 를 사용하는 것입니다.
회귀 모델의 잔차 표준 오차는 다음과 같이 계산됩니다.
잔차 표준 오차 = √ SS 잔차 / df 잔차
금:
- 잔차 SS : 잔차 제곱합입니다.
- 잔차 df : 잔차 자유도, n – k – 1로 계산됩니다. 여기서 n = 총 관측치 수이고 k = 총 모델 매개변수 수입니다.
R에서 회귀 모델의 잔차 표준 오차를 계산하는 데 사용할 수 있는 세 가지 방법이 있습니다.
방법 1: 모델 요약 분석
잔차 표준 오차를 얻는 첫 번째 방법은 단순히 선형 회귀 모델을 적합시킨 다음 summary() 명령을 사용하여 모델 결과를 얻는 것입니다. 그런 다음 출력 하단에서 “잔류 표준 오류”를 찾으십시오.
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
잔차 표준오차는 3.127 임을 알 수 있습니다.
방법 2: 간단한 수식 사용
잔차 표준 오차(RSE)를 구하는 또 다른 방법은 선형 회귀 모델을 적합시킨 후 다음 공식을 사용하여 RSE를 계산하는 것입니다.
sqrt( deviance (model)/df. residual (model))
R에서 이 공식을 구현하는 방법은 다음과 같습니다.
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
잔차 표준오차는 3.126601 임을 알 수 있습니다.
방법 3: 단계별 공식 사용
잔차 표준 오차를 얻는 또 다른 방법은 선형 회귀 모델을 적합시킨 다음 단계별 접근 방식을 사용하여 RSE 공식의 각 개별 구성 요소를 계산하는 것입니다.
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
잔차 표준오차는 3.126601 임을 알 수 있습니다.
잔차 표준 오차를 해석하는 방법
앞서 언급했듯이 잔차 표준 오차(RSE)는 회귀 모델에서 잔차의 표준 편차를 측정하는 방법입니다.
CSR 값이 낮을수록 모델이 데이터에 더 잘 맞는다는 뜻입니다(그러나 과적합 에 주의하세요). 이는 두 개 이상의 모델을 비교하여 데이터에 가장 적합한 모델을 결정할 때 사용하는 유용한 측정항목이 될 수 있습니다.
추가 리소스
잔차 표준 오차를 해석하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 모델 성능을 교차 검증하는 방법
R에서 표준편차를 계산하는 방법