R의 회귀 모델 출력에서 pr(>|t|)를 해석하는 방법
R에서 선형 회귀를 수행할 때마다 회귀 모델의 출력은 다음 형식으로 표시됩니다.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
Pr(>|t|) 열은 t 값 열의 값과 연관된 p 값을 나타냅니다.
p-값이 특정 유의 수준(예: α = 0.05)보다 낮으면 예측 변수는 모델의 반응 변수와 통계적으로 유의한 관계가 있는 것으로 간주됩니다.
다음 예에서는 특정 회귀 모델에 대한 Pr(>|t|) 열의 값을 해석하는 방법을 보여줍니다.
예: Pr(>|t|) 값을 해석하는 방법
예측 변수 x1 및 x2 와 단일 응답 변수 y를 사용하여 다중 선형 회귀 모델을 적합화한다고 가정합니다.
다음 코드는 데이터 프레임을 생성하고 회귀 모델을 데이터에 맞추는 방법을 보여줍니다.
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
Pr(>|t|) 열의 값을 해석하는 방법은 다음과 같습니다.
- 예측 변수 x1의 p-값은 0.0325 입니다. 이 값은 0.05보다 작으므로 모형의 반응변수와 통계적으로 유의한 관계가 있습니다.
- 예측 변수 x2의 p-값은 0.3732 입니다. 이 값은 0.05 이상이므로 모형의 반응변수와 통계적으로 유의한 관계가 없습니다.
계수 표 아래의 유의성 코드는 p-값 0.0325 옆에 단일 별표(*)가 있으면 p-값이 α = 0.05에서 통계적으로 유의하다는 것을 의미합니다.
Pr(>|t|)는 실제로 어떻게 계산되나요?
Pr(>|t|) 값이 실제로 계산되는 방법은 다음과 같습니다.
1단계: t-값 계산
먼저 다음 공식을 사용하여 t 값을 계산합니다.
- t-값 = 추정치 / 표준치 오류
예를 들어 예측 변수 x1에 대한 t 값을 계산하는 방법은 다음과 같습니다.
#calculate t-value
1.4758 / .5029
[1] 2.934579
2단계: p-값 계산
다음으로 p-값을 계산합니다. 이는 t 분포의 절대값이 2.935보다 클 확률을 나타냅니다.
이 값을 계산하려면 R에서 다음 공식을 사용할 수 있습니다.
- p-값 = 2 * pt(abs(t-값), 잔차 df, lower.tail = FALSE)
예를 들어, 잔차 자유도가 5개인 t-값 2.935에 대한 p-값을 계산하는 방법은 다음과 같습니다.
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
이 p-값은 위 회귀 결과의 p-값과 일치합니다.
참고: 잔차 자유도 값은 회귀 결과의 맨 아래에 있습니다. 이 예에서는 5로 나타났습니다.
Residual standard error: 1.867 on 5 degrees of freedom
추가 리소스
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀 결과를 플롯하는 방법