R의 로지스틱 회귀 출력에서 pr(>|z|)를 해석하는 방법


R에서 로지스틱 회귀를 수행할 때마다 회귀 모델의 출력은 다음 형식으로 표시됩니다.

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Pr(>|z|) 열은 z 값 열의 값과 연관된 p 값을 나타냅니다.

p-값이 특정 유의 수준(예: α = 0.05)보다 낮으면 예측 변수가 모델의 반응 변수 와 통계적으로 유의한 관계가 있음을 나타냅니다.

다음 예에서는 실제로 로지스틱 회귀 모델에 대한 Pr(>|z|) 열의 값을 해석하는 방법을 보여줍니다.

예: Pr(>|z|) 값을 해석하는 방법

다음 코드는 내장된 mtcars 데이터 세트를 사용하여 R에서 로지스틱 회귀 모델을 맞추는 방법을 보여줍니다.

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Pr(>|z|) 열의 값을 해석하는 방법은 다음과 같습니다.

  • 예측 변수 “disp”의 p-값은 0.5305 입니다. 이 값은 0.05 이상이므로 모형의 반응변수와 통계적으로 유의한 관계가 없습니다.
  • 예측 변수 “drat”의 p-값은 0.0315 입니다. 이 값은 0.05보다 작으므로 모형의 반응변수와 통계적으로 유의한 관계가 있습니다.

계수 표 아래의 유의성 코드는 p-값 0.0315 옆에 있는 단일 별표(*)는 p-값이 α = 0.05에서 통계적으로 유의하다는 것을 의미합니다.

Pr(>|z|)는 어떻게 계산되나요?

Pr(>|z|) 값이 실제로 계산되는 방법은 다음과 같습니다.

1단계: z 값 계산

먼저 다음 공식을 사용하여 z 값을 계산합니다.

  • z 값 = 추정치 / 표준 오류

예를 들어 예측 변수 “drat”에 대한 z 값을 계산하는 방법은 다음과 같습니다.

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

2단계: p-값 계산

다음으로 양측 p-값을 계산합니다. 이는 정규분포의 절대값이 2.151보다 크거나 -2.151보다 작을 확률을 나타냅니다.

이 값을 계산하려면 R에서 다음 공식을 사용할 수 있습니다.

  • p-값 = 2 * (1-pnorm(z-값))

예를 들어, z-값 2.151에 대한 양측 p-값을 계산하는 방법은 다음과 같습니다.

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

이 p-값은 위 회귀 결과의 p-값과 일치합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다양한 회귀 모델을 맞추는 방법을 설명합니다.

R에서 로지스틱 회귀를 수행하는 방법
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다