Как интерпретировать pr(>|z|) в выходных данных логистической регрессии в r


Всякий раз, когда вы выполняете логистическую регрессию в R, выходные данные вашей модели регрессии будут отображаться в следующем формате:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Столбец Pr(>|z|) представляет значение p, связанное со значением в столбце значений z .

Если значение p ниже определенного уровня значимости (например, α = 0,05), это указывает на то, что переменная-предиктор имеет статистически значимую связь с переменной ответа в модели.

В следующем примере показано, как на практике интерпретировать значения столбца Pr(>|z|) для модели логистической регрессии.

Пример: Как интерпретировать значения Pr(>|z|)

Следующий код показывает, как подогнать модель логистической регрессии в R с использованием встроенного набора данных mtcars :

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Вот как интерпретировать значения в столбце Pr(>|z|):

  • Значение p для переменной-предиктора «disp» составляет 0,5305 . Поскольку это значение не менее 0,05, оно не имеет статистически значимой связи с переменной отклика в модели.
  • Значение p для переменной-предиктора «drat» составляет 0,0315 . Поскольку это значение меньше 0,05, существует статистически значимая связь с переменной отклика в модели.

Коды значимости под таблицей коэффициентов сообщают нам, что одна звездочка (*) рядом со значением p 0,0315 означает, что значение p статистически значимо при α = 0,05.

Как рассчитывается Pr(>|z|)?

Вот как на самом деле рассчитывается значение Pr(>|z|):

Шаг 1: Рассчитайте значение z

Сначала мы вычисляем значение z по следующей формуле:

  • Значение z = Оценка / Стандарт. Ошибка

Например, вот как вычислить значение z для переменной-предиктора «drat»:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Шаг 2: Рассчитайте значение p

Далее мы вычисляем двустороннее значение p. Это представляет собой вероятность того, что абсолютное значение нормального распределения больше 2,151 или меньше -2,151.

Для расчета этого значения мы можем использовать следующую формулу в R:

  • p-значение = 2 * (1-pnorm(z-значение))

Например, вот как вычислить двустороннее значение p для значения z 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Обратите внимание, что это значение p соответствует значению p в выходных данных регрессии выше.

Дополнительные ресурсы

В следующих руководствах объясняется, как адаптировать различные модели регрессии в R:

Как выполнить логистическую регрессию в R
Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *