如何解释回归模型中的截距:举例
回归模型中的截距(有时称为“常数”)表示模型中所有预测变量均为零时响应变量的平均值。
本教程介绍如何解释简单线性回归和多元线性回归模型中的原始值。
简单线性回归中交集的解释
简单的线性回归模型采用以下形式:
ŷ = β 0 + β 1 (x)
金子:
- ŷ:响应变量的预测值
- β 0 :x = 0 时响应变量的平均值
- β 1 : x 增加 1 个单位时响应变量的平均变化
- x:预测变量的值
在某些情况下,在简单的线性回归模型中解释截距值是有意义的,但并非总是如此。以下示例说明了这一点。
示例 1:拦截的解释是有意义的
假设我们想要使用学习时间作为预测变量、考试成绩作为响应变量来拟合一个简单的线性回归模型。
我们收集某所大学课程的 50 名学生的数据,并拟合以下回归模型:
考试成绩 = 65.4 + 2.67(小时)
该模型中原始项的值为65.4 。这意味着当学习时数为零时,平均考试成绩为65.4 。
这解释起来很有意义,因为学生为了考试而学习零小时是合理的。
示例2:拦截没有解释意义
假设我们想要使用体重(以磅为单位)作为预测变量,以身高(以英寸为单位)作为响应变量来拟合一个简单的线性回归模型。
我们收集了 50 个人的数据并应用以下回归模型:
高度 = 22.3 + 0.28(磅)
该模型中原始项的值为22.3 。这意味着当体重为零时,人的平均身高为22.3英寸。
这没有任何解释意义,因为一个人的体重不可能为零。
但是,我们仍然需要在模型中保留原始项,以便我们可以使用模型进行预测。截距对于该模型没有任何有意义的解释。
多元线性回归中截距的解释
多元线性回归模型采用以下形式:
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
金子:
- ŷ:响应变量的预测值
- β 0 :当所有预测变量为零时响应变量的平均值
- β j :假设所有其他预测变量保持不变,第 j个预测变量增加 1 个单位时响应变量的平均变化。
- x j :第 j个预测变量的值
与简单线性回归类似,有时解释多元线性回归模型中的截距值是有意义的,但并非总是如此。以下示例说明了这一点。
示例 1:拦截的解释是有意义的
假设我们想要使用学习时间和预备考试作为预测变量,考试成绩作为响应变量来拟合多元线性回归模型。
我们收集某所大学课程的 50 名学生的数据,并拟合以下回归模型:
考试成绩=58.4+2.23(小时)+1.34(预科考试次数)
该模型中原始项的值为58.4 。这意味着当学习时数和准备考试次数均为零时,平均考试成绩为58.4 。
这解释起来是有道理的,因为学生零小时学习并且在考试前不参加任何准备考试是合理的。
示例2:拦截没有解释意义
假设我们想要拟合一个多元线性回归模型,使用平方英尺和卧室数量作为预测变量,销售价格作为响应变量。
我们收集某个城市 100 栋房屋的数据并应用以下回归模型:
价格 = 87,244 + 3.44(平方英尺)+ 843.45(卧室数量)
该模型中原始项的值为87.244 。这意味着当房屋面积和卧室数量均为零时,平均房屋销售价格为87,244 美元。
这没有任何解释意义,因为房子不可能有零平方英尺和零卧室。
然而,我们仍然需要在模型中保留原始项,以便用它来进行预测。截距对于该模型没有任何有意义的解释。