Як інтерпретувати pr(>|z|) у результатах логістичної регресії в r


Щоразу, коли ви виконуєте логістичну регресію в R, вихід вашої моделі регресії відображатиметься в такому форматі:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Стовпець Pr(>|z|) представляє значення p, пов’язане зі значенням у стовпці значення z .

Якщо p-значення нижче певного рівня значущості (наприклад, α = 0,05), це вказує на те, що прогностична змінна має статистично значущий зв’язок зі змінною відповіді в моделі.

У наступному прикладі показано, як інтерпретувати значення стовпця Pr(>|z|) для моделі логістичної регресії на практиці.

Приклад: як інтерпретувати значення Pr(>|z|).

Наступний код показує, як підібрати модель логістичної регресії в R за допомогою вбудованого набору даних mtcars :

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Ось як інтерпретувати значення в стовпці Pr(>|z|):

  • P-значення для змінної предиктора disp становить 0,5305 . Оскільки це значення не менше 0,05, воно не має статистично значущого зв’язку зі змінною відповіді в моделі.
  • P-значення для змінної предиктора “drat” становить 0,0315 . Оскільки це значення менше 0,05, існує статистично значущий зв’язок зі змінною відповіді в моделі.

Коди значущості під таблицею коефіцієнтів говорять нам, що одна зірочка (*) поруч із значенням p 0,0315 означає, що значення p є статистично значущим при α = 0,05.

Як обчислюється Pr(>|z|)?

Ось як фактично обчислюється значення Pr(>|z|):

Крок 1: обчисліть значення z

Спочатку ми обчислюємо значення z за такою формулою:

  • значення z = Оцінка / Стандарт. Помилка

Наприклад, ось як обчислити значення z для змінної предиктора «drat»:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Крок 2: Обчисліть p-значення

Далі ми обчислюємо двостороннє p-значення. Це ймовірність того, що абсолютне значення нормального розподілу більше 2,151 або менше -2,151.

Ми можемо використати таку формулу в R, щоб обчислити це значення:

  • p-значення = 2 * (1-pnorm(z-значення))

Наприклад, ось як обчислити двобічне p-значення для z-значення 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Зауважте, що це p-значення збігається з p-значенням у вихідних даних регресії вище.

Додаткові ресурси

У наступних посібниках пояснюється, як підігнати різні моделі регресії в R:

Як виконати логістичну регресію в R
Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *