如何解释 r 中逻辑回归输出中的 pr(>|z|)


每当您在 R 中执行逻辑回归时,回归模型的输出将以以下格式显示:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Pr(>|z|)列表示与z 值列中的值关联的 p 值。

如果 p 值低于一定的显着性水平(例如 α = 0.05),则表明预测变量与模型中的响应变量具有统计显着关系。

以下示例展示了如何在实践中解释逻辑回归模型的 Pr(>|z|) 列的值。

示例:如何解释 Pr(>|z|) 值

以下代码展示了如何使用内置mtcars数据集在 R 中拟合逻辑回归模型

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

以下是如何解释 Pr(>|z|) 列中的值:

  • 预测变量“disp”的 p 值为0.5305 。由于该值不小于0.05,因此与模型中的响应变量不具有统计显着关系。
  • 预测变量“drat”的 p 值为0.0315 。由于该值小于 0.05,因此与模型中的响应变量存在统计显着关系。

系数表下方的显着性代码告诉我们,p 值 0.0315 旁边的单个星号 (*) 表示 p 值在 α = 0.05 时具有统计显着性。

Pr(>|z|) 是如何计算的?

以下是 Pr(>|z|) 值的实际计算方式:

步骤1:计算z值

首先,我们使用以下公式计算z 值

  • z 值= 估计值 / 标准值错误

例如,以下是如何计算预测变量“drat”的 z 值:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

步骤 2:计算 p 值

接下来,我们计算双尾 p 值。这表示正态分布的绝对值大于 2.151 或小于 -2.151 的概率。

我们可以在R中使用以下公式来计算该值:

  • p 值= 2 * (1-pnorm(z 值))

例如,以下是如何计算 z 值为 2.151 的双尾 p 值:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

请注意,此 p 值与上面回归输出中的 p 值匹配。

其他资源

以下教程解释了如何在 R 中拟合不同的回归模型:

如何在 R 中执行逻辑回归
如何在 R 中执行简单线性回归
如何在 R 中执行多元线性回归

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注