如何解释回归模型中的截距:举例


回归模型中的截距(有时称为“常数”)表示模型中所有预测变量均为零时响应变量的平均值。

本教程介绍如何解释简单线性回归和多元线性回归模型中的原始值。

简单线性回归中交集的解释

简单的线性回归模型采用以下形式:

ŷ = β 0 + β 1 (x)

金子:

  • ŷ:响应变量的预测值
  • β 0 :x = 0 时响应变量的平均值
  • β 1 : x 增加 1 个单位时响应变量的平均变化
  • x:预测变量的值

在某些情况下,在简单的线性回归模型中解释截距值是有意义的,但并非总是如此。以下示例说明了这一点。

示例 1:拦截的解释是有意义的

假设我们想要使用学习时间作为预测变量、考试成绩作为响应变量来拟合一个简单的线性回归模型。

我们收集某所大学课程的 50 名学生的数据,并拟合以下回归模型:

考试成绩 = 65.4 + 2.67(小时)

该模型中原始项的值为65.4 。这意味着当学习时数为零时,平均考试成绩为65.4

这解释起来很有意义,因为学生为了考试而学习零小时是合理的。

示例2:拦截没有解释意义

假设我们想要使用体重(以磅为单位)作为预测变量,以身高(以英寸为单位)作为响应变量来拟合一个简单的线性回归模型。

我们收集了 50 个人的数据并应用以下回归模型:

高度 = 22.3 + 0.28(磅)

该模型中原始项的值为22.3 。这意味着当体重为零时,人的平均身高为22.3英寸。

这没有任何解释意义,因为一个人的体重不可能为零。

但是,我们仍然需要在模型中保留原始项,以便我们可以使用模型进行预测。截距对于该模型没有任何有意义的解释。

多元线性回归中截距的解释

多元线性回归模型采用以下形式:

ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )

金子:

  • ŷ:响应变量的预测值
  • β 0 :当所有预测变量为零时响应变量的平均值
  • β j :假设所有其他预测变量保持不变,第 j预测变量增加 1 个单位时响应变量的平均变化。
  • x j :第 j预测变量的值

与简单线性回归类似,有时解释多元线性回归模型中的截距值是有意义的,但并非总是如此。以下示例说明了这一点。

示例 1:拦截的解释是有意义的

假设我们想要使用学习时间预备考试作为预测变量,考试成绩作为响应变量来拟合多元线性回归模型。

我们收集某所大学课程的 50 名学生的数据,并拟合以下回归模型:

考试成绩=58.4+2.23(小时)+1.34(预科考试次数)

该模型中原始项的值为58.4 。这意味着当学习时数和准备考试次数均为零时,平均考试成绩为58.4

这解释起来是有道理的,因为学生零小时学习并且在考试前不参加任何准备考试是合理的。

示例2:拦截没有解释意义

假设我们想要拟合一个多元线性回归模型,使用平方英尺卧室数量作为预测变量,销售价格作为响应变量。

我们收集某个城市 100 栋房屋的数据并应用以下回归模型:

价格 = 87,244 + 3.44(平方英尺)+ 843.45(卧室数量)

该模型中原始项的值为87.244 。这意味着当房屋面积和卧室数量均为零时,平均房屋销售价格为87,244 美元

这没有任何解释意义,因为房子不可能有零平方英尺和零卧室。

然而,我们仍然需要在模型中保留原始项,以便用它来进行预测。截距对于该模型没有任何有意义的解释。

其他资源

简单线性回归简介
多元线性回归简介
如何解释偏回归系数

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注