如何在 excel 中执行二次回归
回归是一种统计技术,我们可以用它来解释一个或多个预测变量与响应变量之间的关系。最常见的回归类型是线性回归,当预测变量和响应变量之间的关系为线性时,我们会使用线性回归。
换句话说,当预测变量增加时,响应变量也趋于增加。例如,我们可以使用线性回归模型来描述学习时数(预测变量)与学生考试成绩(响应变量)之间的关系。
然而,有时预测变量和响应变量之间的关系是非线性的。非线性关系的一种常见类型是二次关系,它在图形上可能看起来像 U 形或倒 U 形。
也就是说,随着预测变量的增加,响应变量也趋于增加,但在某一点之后,随着预测变量继续增加,响应变量开始减少。
例如,我们可以使用二次回归模型来描述工作时间与一个人报告的幸福水平之间的关系。也许一个人工作得越多,他们就会感到越有成就感,但一旦达到一定的阈值,更多的工作实际上会导致压力和幸福感下降。在这种情况下,二次回归模型比线性回归模型更适合数据。
让我们回顾一下如何在 Excel 中执行二次回归的示例。
Excel 中的二次回归
假设我们有 16 个不同的人每周工作时数和报告的幸福程度(范围为 0 到 100)的数据:
首先,我们创建一个散点图来查看线性回归是否是适合数据的模型。
突出显示单元格A2:B17 。接下来,单击顶部功能区的插入选项卡,然后单击图表区域中的散点图。这将生成数据的散点图:
很容易看出,工作时间和报告的幸福感之间的关系并不是线性的。事实上,它遵循“U”形状,使其成为二次回归的完美候选者。
在将二次回归模型拟合到数据之前,我们需要为预测变量的平方值创建一个新列。
首先,突出显示 B 列中的所有值并将它们拖动到 C 列。
接下来,在单元格 B2 中键入公式=A2^2 。这会产生值36 。接下来,单击单元格 B2 的右下角并向下拖动公式以填充 B 列中的其余单元格。
接下来,我们将拟合二次回归模型。
单击顶部功能区的“数据”,然后单击最右侧的“数据分析”选项。如果您没有看到此选项,则必须首先安装免费的分析工具库软件。
单击“数据分析”后,将出现一个框。单击“回归” ,然后单击“确定” 。
接下来,在出现的回归框中填写以下值。然后单击“确定” 。
将显示以下结果:
以下是如何解释输出中的不同数字:
R 方:也称为决定系数,是响应变量中可以由预测变量解释的方差的比例。在此示例中,R 平方为0.9092 ,表明报告的幸福水平中 90.92% 的方差可以通过工作小时数和工作小时数 ^2 来解释。
标准误差:回归的标准误差是观测值与回归线之间的平均距离。在此示例中,观测值与回归线平均偏差9,519 个单位。
F 统计量: F 统计量计算为回归 MS/残余 MS。该统计数据表明回归模型是否比不包含自变量的模型更适合数据。本质上,它测试整个回归模型是否有用。一般来说,如果模型中的预测变量均不具有统计显着性,则总体 F 统计量也不具有统计显着性。在此示例中,F 统计量为65.09 ,相应的 p 值 <0.0001。由于该 p 值小于 0.05,因此整个回归模型显着。
回归系数:最后一个表中的回归系数为我们提供了编写估计回归方程所需的数字:
y帽子= b 0 + b 1 x 1 + b 2 x 1 2
在本例中,估计回归方程为:
宣称的幸福水平 = -30.252 + 7.173(工作时间)-0.106(工作时间) 2
我们可以使用这个方程根据个人的工作时间来计算他们的预期幸福水平。例如,每周工作 30 小时的人的预期幸福水平是:
报告的幸福水平 = -30.252 + 7.173(30) -0.106(30) 2 = 88.649 。
其他资源
如何在Excel中添加二次趋势线
如何阅读和解释回归表
什么是好的 R 平方值?
了解回归的标准误差
理解回归中整体显着性 F 检验的简单指南