R에서 회귀선의 기울기에 대해 t-테스트를 수행하는 방법
간단한 선형 회귀를 수행하면 다음과 같은 추정 회귀 방정식이 생성됩니다.
ŷ = b0 + b1x
우리는 일반적으로 기울기 계수 b 1 이 통계적으로 유의한지 여부를 알고 싶습니다.
b 1 이 통계적으로 유의한지 여부를 확인하기 위해 다음 검정 통계량을 사용하여 t-검정을 수행할 수 있습니다.
t = b 1 / se(b 1 )
금:
- se(b 1 ) 은 b 1 의 표준 오차를 나타냅니다.
그런 다음 n-2 자유도를 사용하여 이 검정 통계량에 해당하는 p-값을 계산할 수 있습니다.
p-값이 특정 임계값(예: α = 0.05)보다 작으면 기울기 계수가 0이 아니라고 결론을 내릴 수 있습니다.
즉, 모델의 예측 변수와 반응 변수 사이에는 통계적으로 유의미한 관계가 있습니다.
다음 예에서는 R에서 회귀선의 기울기에 대해 t-검정을 수행하는 방법을 보여줍니다.
예: R의 회귀선 기울기에 대한 t-검정 실행
한 수업에서 12명의 학생이 공부한 시간과 최종 시험 점수에 대한 정보가 포함된 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
공부한 시간과 시험 점수 사이에 통계적으로 유의미한 관계가 있는지 확인하기 위해 간단한 선형 회귀 모델을 적용한다고 가정해 보겠습니다.
이 회귀 모델에 맞게 R의 lm() 함수를 사용할 수 있습니다.
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
모델 결과에서 추정된 회귀 방정식은 다음과 같습니다.
시험 점수 = 67.7685 + 2.7037(시간)
기울기 계수가 통계적으로 유의한지 여부를 테스트하기 위해 다음과 같이 t-검정 통계량을 계산할 수 있습니다.
- t = b 1 / se(b 1 )
- t = 2.7037 / 0.7456
- 티 = 3.626
이 t-검정 통계량에 해당하는 p-값은 출력의 Pr(> |t|) 열에 표시됩니다.
p-값은 0.00464 로 나타났습니다.
이 p-값은 0.05보다 작으므로 기울기 계수가 통계적으로 유의하다는 결론을 내립니다.
즉, 공부한 시간과 시험에서 받은 최종 성적 사이에는 통계적으로 유의미한 관계가 있다는 것입니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 회귀 출력을 해석하는 방법