Як інтерпретувати pr(>|z|) у результатах логістичної регресії в r
Щоразу, коли ви виконуєте логістичну регресію в R, вихід вашої моделі регресії відображатиметься в такому форматі:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305
drat 4.879396 2.268115 2.151 0.0315 *
Стовпець Pr(>|z|) представляє значення p, пов’язане зі значенням у стовпці значення z .
Якщо p-значення нижче певного рівня значущості (наприклад, α = 0,05), це вказує на те, що прогностична змінна має статистично значущий зв’язок зі змінною відповіді в моделі.
У наступному прикладі показано, як інтерпретувати значення стовпця Pr(>|z|) для моделі логістичної регресії на практиці.
Приклад: як інтерпретувати значення Pr(>|z|).
Наступний код показує, як підібрати модель логістичної регресії в R за допомогою вбудованого набору даних mtcars :
#fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)
#view model summary
summary(model)
Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5773 -0.2273 -0.1155 0.5196 1.8957
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268
Number of Fisher Scoring iterations: 6
Ось як інтерпретувати значення в стовпці Pr(>|z|):
- P-значення для змінної предиктора disp становить 0,5305 . Оскільки це значення не менше 0,05, воно не має статистично значущого зв’язку зі змінною відповіді в моделі.
- P-значення для змінної предиктора “drat” становить 0,0315 . Оскільки це значення менше 0,05, існує статистично значущий зв’язок зі змінною відповіді в моделі.
Коди значущості під таблицею коефіцієнтів говорять нам, що одна зірочка (*) поруч із значенням p 0,0315 означає, що значення p є статистично значущим при α = 0,05.
Як обчислюється Pr(>|z|)?
Ось як фактично обчислюється значення Pr(>|z|):
Крок 1: обчисліть значення z
Спочатку ми обчислюємо значення z за такою формулою:
- значення z = Оцінка / Стандарт. Помилка
Наприклад, ось як обчислити значення z для змінної предиктора «drat»:
#calculate z-value 4.879396 / 2.268115 [1] 2.151
Крок 2: Обчисліть p-значення
Далі ми обчислюємо двостороннє p-значення. Це ймовірність того, що абсолютне значення нормального розподілу більше 2,151 або менше -2,151.
Ми можемо використати таку формулу в R, щоб обчислити це значення:
- p-значення = 2 * (1-pnorm(z-значення))
Наприклад, ось як обчислити двобічне p-значення для z-значення 2,151:
#calculate p-value
2*(1-pnorm(2.151))
[1] 0.0314762
Зауважте, що це p-значення збігається з p-значенням у вихідних даних регресії вище.
Додаткові ресурси
У наступних посібниках пояснюється, як підігнати різні моделі регресії в R:
Як виконати логістичну регресію в R
Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R