完整指南:如何报告逻辑回归结果
逻辑回归是当响应变量是二元时我们使用的一种回归分析。
我们可以使用以下通用格式来报告逻辑回归模型的结果:
使用Logistic回归分析[预测变量1]、[预测变量2]、…[预测变量n ]和[响应变量]之间的关系。
研究发现,在保持所有其他预测变量不变的情况下,每增加一个单位,[响应变量]发生[增加或减少]的概率[百分之几](95% CI [下限,上限]) [预测变量1]。
研究发现,在保持所有其他预测变量不变的情况下,每增加一个单位,[响应变量]发生[增加或减少]的概率[百分之几](95% CI [下限,上限]) [预测变量2]。
……
我们可以使用此基本语法来报告优势比以及模型中每个预测变量的优势比相应的 95% 置信区间。
以下示例展示了如何在实践中报告逻辑回归模型的结果。
示例:报告 Logistic 回归结果
假设一位教授想要了解两个不同的学习课程(课程 A 和课程 B)以及学习时数是否会影响学生通过班级期末考试的概率。
它使用学习时间和学习计划作为预测变量,使用考试结果(通过或失败)作为响应变量来拟合逻辑回归模型。
以下输出显示了逻辑回归模型的结果:
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.415 0.623 -3.876 <0.000 program_A 0.344 0.156 2.205 0.027 hours 0.006 0.002 3.000 0.003
在报告逻辑回归模型的结果之前,我们必须首先使用公式 e β计算每个预测变量的优势比。
例如,以下是计算每个预测变量的优势比的方法:
- 计划优势比:e 0.344 = 1.41
- 小时优势比:e 0.006 = 1.006
我们还需要使用公式 e (β +/- 1.96*标准误差)计算每个预测变量的优势比的 95% 置信区间。
例如,以下是计算每个预测变量的优势比的方法:
- 项目比值比的 95% CI:e 0.344 +/- 1.96*0.156 = [1.04, 1.92]
- 小时比值比的 95% CI:e 0.006 +/- 1.96*0.002 = [1.002, 1.009]
现在我们已经计算了每个预测变量的优势比和相应的置信区间,我们可以报告模型结果如下:
使用逻辑回归来分析课程和学习时间之间的关系与通过期末考试的概率。
结果发现,在保持学习时数不变的情况下,使用学习计划 A 的学生与使用学习计划 B 的学生通过期末考试的机会增加了 41% (95% CI [0.04, 0.92])。
研究还发现,在保持学习计划不变的情况下,每多学习一小时,通过期末考试的几率就会增加 0.6% (95% CI [0.002, 0.009])。
请注意,我们报告的是预测变量的优势比,而不是模型 beta 值,因为优势比更容易解释和理解。
其他资源
以下教程提供了有关逻辑回归的更多信息:
逻辑回归简介
如何在 R 中执行逻辑回归
如何在 Python 中执行逻辑回归
现实生活中使用逻辑回归的 4 个示例