R의 회귀 모델 출력에서 pr(>|t|)를 해석하는 방법


R에서 선형 회귀를 수행할 때마다 회귀 모델의 출력은 다음 형식으로 표시됩니다.

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Pr(>|t|) 열은 t 값 열의 값과 연관된 p 값을 나타냅니다.

p-값이 특정 유의 수준(예: α = 0.05)보다 낮으면 예측 변수는 모델의 반응 변수와 통계적으로 유의한 관계가 있는 것으로 간주됩니다.

다음 예에서는 특정 회귀 모델에 대한 Pr(>|t|) 열의 값을 해석하는 방법을 보여줍니다.

예: Pr(>|t|) 값을 해석하는 방법

예측 변수 x1x2 와 단일 응답 변수 y를 사용하여 다중 선형 회귀 모델을 적합화한다고 가정합니다.

다음 코드는 데이터 프레임을 생성하고 회귀 모델을 데이터에 맞추는 방법을 보여줍니다.

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Pr(>|t|) 열의 값을 해석하는 방법은 다음과 같습니다.

  • 예측 변수 x1의 p-값은 0.0325 입니다. 이 값은 0.05보다 작으므로 모형의 반응변수와 통계적으로 유의한 관계가 있습니다.
  • 예측 변수 x2의 p-값은 0.3732 입니다. 이 값은 0.05 이상이므로 모형의 반응변수와 통계적으로 유의한 관계가 없습니다.

계수 표 아래의 유의성 코드는 p-값 0.0325 옆에 단일 별표(*)가 있으면 p-값이 α = 0.05에서 통계적으로 유의하다는 것을 의미합니다.

Pr(>|t|)는 실제로 어떻게 계산되나요?

Pr(>|t|) 값이 실제로 계산되는 방법은 다음과 같습니다.

1단계: t-값 계산

먼저 다음 공식을 사용하여 t 값을 계산합니다.

  • t-값 = 추정치 / 표준치 오류

예를 들어 예측 변수 x1에 대한 t 값을 계산하는 방법은 다음과 같습니다.

 #calculate t-value
1.4758 / .5029

[1] 2.934579

2단계: p-값 계산

다음으로 p-값을 계산합니다. 이는 t 분포의 절대값이 2.935보다 클 확률을 나타냅니다.

이 값을 계산하려면 R에서 다음 공식을 사용할 수 있습니다.

  • p-값 = 2 * pt(abs(t-값), 잔차 df, lower.tail = FALSE)

예를 들어, 잔차 자유도가 5개인 t-값 2.935에 대한 p-값을 계산하는 방법은 다음과 같습니다.

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

이 p-값은 위 회귀 결과의 p-값과 일치합니다.

참고: 잔차 자유도 값은 회귀 결과의 맨 아래에 있습니다. 이 예에서는 5로 나타났습니다.

 Residual standard error: 1.867 on 5 degrees of freedom

추가 리소스

R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀 결과를 플롯하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다