如何解释 excel 中的回归输出
多元线性回归是所有统计学中最常用的技术之一。
本教程介绍如何在 Excel 中解释多元线性回归模型输出中的每个值。
示例:解释 Excel 中的回归输出
假设我们想知道学习时间和参加预科考试的次数是否会影响学生在某次高考中的成绩。
为了探索这种关系,我们可以使用学习时间和准备考试作为预测变量,考试成绩作为响应变量来执行多元线性回归。
以下屏幕截图显示了该模型在 Excel 中的回归输出:
以下是如何解释输出中的最大值:
倍数 R:0.857 。这表示响应变量和两个预测变量之间的多重相关性。
R 方: 0.734 。这称为决定系数。它是响应变量的方差可以被解释变量解释的比例。在此示例中,73.4% 的考试成绩差异是由学习时数和参加的准备考试次数来解释的。
调整后的 R 方:0.703 。这表示 R 方值,根据模型中预测变量的数量进行调整。该值也将低于 R Square 值,并将惩罚在模型中使用过多预测变量的模型。
标准误差: 5.366 。这是观测值与回归线之间的平均距离。在此示例中,观测值与回归线平均偏差 5,366 个单位。
评论:20 。用于生成回归模型的数据集的总样本量。
F: 11:46 pm这是回归模型的总体 F 统计量,计算为回归 MS/残余 MS。
含义 F:0.0000 。这是与总体 F 统计量相关的 p 值。这告诉我们回归模型作为一个整体是否具有统计显着性。
在这种情况下,p 值小于 0.05,表明解释变量、学习时间和参加的准备考试相结合,与考试结果具有统计显着相关性。
系数:假设其他解释变量保持不变,每个解释变量的系数告诉我们响应变量的预期平均变化。
例如,假设练习考试保持不变,学习时间每增加一小时,平均考试成绩预计会增加5.56 分。
我们将截距系数解释为不学习任何时间且不参加预备考试的学生的预期考试成绩为67.67 。
P 值。各个 p 值告诉我们每个解释变量是否具有统计显着性。我们可以看到,学习时间具有统计显着性 (p = 0.00),而参加的预备考试(p = 0.52) 在 α = 0.05 时不具有统计显着性。
如何写估计回归方程
我们可以使用模型输出的系数来创建以下估计回归方程:
考试成绩 = 67.67 + 5.56*(小时) – 0.60*(预备考试)
我们可以使用这个估计的回归方程根据学生的学习小时数和参加练习考试的次数来计算学生的预期考试成绩。
例如,学习三个小时并参加预备考试的学生应该得到83.75的成绩:
考试成绩 = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
请记住,由于过去的准备考试在统计上不显着 (p=0.52),我们可能会决定删除它们,因为它们不会对整体模型提供任何改进。
在这种情况下,我们可以仅使用研究的时间作为解释变量来执行简单的线性回归。