R의 회귀 계수에 대한 신뢰 구간을 계산하는 방법
선형 회귀 모델에서 회귀 계수는 예측 변수의 1단위 증가와 관련된 응답 변수 의 평균 변화를 알려줍니다.
다음 공식을 사용하여 회귀 계수에 대한 신뢰 구간을 계산할 수 있습니다.
β 1 에 대한 신뢰구간: b 1 ± t 1-α/2, n-2 * se(b 1 )
금:
- b 1 = 회귀표에 표시된 회귀계수
- t 1-∝/2, n-2 = 자유도가 n-2인 1-∝ 신뢰 수준에 대한 임계 t 값입니다. 여기서 n 은 데이터 세트의 총 관측 수입니다.
- se(b 1 ) = 회귀표에 표시된 b 1 의 표준 오차
다음 예에서는 실제로 회귀 기울기에 대한 신뢰 구간을 계산하는 방법을 보여줍니다.
예: R의 회귀 계수에 대한 신뢰 구간
특정 수업의 15명의 학생에 대한 학습 시간을 예측 변수로 사용하고 시험 점수를 응답 변수로 사용하여 간단한 선형 회귀 모델을 적합화한다고 가정합니다.

R에서 이 간단한 선형 회귀 모델을 맞추기 위해 lm() 함수를 사용할 수 있습니다.
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
결과의 계수 추정치를 사용하여 다음과 같이 적합 단순 선형 회귀 모델을 작성할 수 있습니다.
점수 = 65.334 + 1.982*(공부한 시간)
시간에 대한 회귀계수는 1.982 입니다.
이는 학습 시간이 추가될 때마다 시험 점수가 평균 1,982 점 증가하는 것과 관련이 있음을 알려줍니다.
회귀계수에 대한 95% 신뢰구간을 계산하기 위해 confint() 함수를 사용할 수 있습니다:
#calculate confidence interval for regression coefficient for 'hours' confint(fit, ' hours ', level= 0.95 ) 2.5% 97.5% hours 1.446682 2.518068
회귀계수의 95% 신뢰구간은 [1.446, 2.518] 입니다.
이 신뢰 구간에는 0 값이 포함되어 있지 않으므로 공부한 시간과 시험 성적 사이에 통계적으로 유의미한 연관성이 있다는 결론을 내릴 수 있습니다.
회귀 계수에 대한 95% 신뢰 구간을 수동으로 계산하여 이것이 올바른지 확인할 수도 있습니다.
- β 1 에 대한 95% CI : b 1 ± t 1-α/2, n-2 * se(b 1 )
- β 1 에 대한 95% CI: 1.982 ± t 0.975, 15-2 * 0.248
- β 1 에 대한 95% CI: 1.982 ± 2.1604 * 0.248
- β 1 에 대한 95% CI: [1.446, 2.518]
회귀계수의 95% 신뢰구간은 [1.446, 2.518] 입니다.
참고 #1 : 우리는 13 자유도의 95% 신뢰 수준에 해당하는 임계 t 값을 찾기 위해 역 t 분포 계산기를 사용했습니다.
참고 #2 : 다른 신뢰 수준을 사용하여 신뢰 구간을 계산하려면 confint() 함수에서 level 인수 값을 변경하면 됩니다.
추가 리소스
다음 튜토리얼은 R의 선형 회귀에 대한 추가 정보를 제공합니다.
R에서 회귀 출력을 해석하는 방법
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 로지스틱 회귀를 수행하는 방법