如何在stata中进行多元线性回归


多元线性回归是一种可用于了解多个解释变量与响应变量之间关系的方法。

本教程介绍如何在 Stata 中执行多元线性回归。

示例:Stata 中的多元线性回归

假设我们想知道每加仑行驶里程和重量是否会影响汽车的价格。为了测试这一点,我们可以使用每加仑英里数和重量作为两个解释变量,使用价格作为响应变量来执行多元线性回归。

在 Stata 中完成以下步骤,使用名为auto的数据集执行多元线性回归,该数据集包含 74 辆不同汽车的数据。

第 1 步:加载数据。

通过在命令框中键入以下内容来加载数据:

使用https://www.stata-press.com/data/r13/auto

步骤 2:获取数据摘要。

通过在命令框中键入以下内容,可以快速了解您正在使用的数据:

总结一下

在Stata中汇总数据

我们可以看到数据集中有 12 个不同的变量,但我们唯一感兴趣的是mpgWeightPrice

我们可以看到这三个变量的基本汇总统计数据如下:

价格|平均 = $6,165,最低 = $3,291,最高 $15,906

英里/加仑|平均值 = 21.29,最小值 = 12,最大值 = 41

重量 |平均 = 3,019 磅,最小 = 1,760 磅,最大 = 4,840 磅

步骤 3:执行多元线性回归。

在命令框中键入以下内容,使用 mpg 和体重作为解释变量,使用价格作为响应变量来执行多元线性回归。

回归价格 mpg 重量

Stata 中的多元回归输出

以下是如何解释结果中最有趣的数字:

概率 > F: 0.000。这是整体回归的 p 值。由于该值小于 0.05,这表明mpg体重的组合解释变量与响应变量Price具有统计显着关系。

R 平方: 0.2934。这是可以由解释变量解释的响应变量方差的比例。在此示例中,29.34% 的价格变化可以通过英里/加仑和重量来解释。

系数(英里/加仑): -49.512。这告诉我们,假设重量保持不变,与每加仑英里数增加一单位相关的平均价格变化。在此示例中,假设重量保持不变,每加仑英里数增加一单位,价格平均下降约 49.51 美元。

例如,假设汽车 A 和 B 的重量均为 2,000 磅。如果汽车 A 的油耗为 20 英里/加仑,而汽车 B 的油耗仅为 19 英里/加仑,我们预计汽车 A 的价格将比汽车 B 的价格低 49.51 美元。

P>|t| (英里/加仑): 0.567。这是与 mpg 检验统计量相关的 p 值。由于该值不小于 0.05,因此我们没有证据表明 mpg 与价格存在统计上显着的关系。

系数(重量): 1,746。这告诉我们,假设每加仑英里数保持不变,与重量增加一单位相关的平均价格变化。在此示例中,假设 mpg 保持不变,重量每增加一个单位,价格平均增加约 1.74 美元。

例如,假设汽车 A 和 B 的油耗均为 20 英里/加仑。如果 A 车比 B 车重 1 磅,那么 A 车的价格应该多 1.74 美元。

P>|t| (重量): 0.008。这是与体重检验统计量相关的 p 值。由于该值小于 0.05,我们有足够的证据表明重量与价格具有统计上显着的关系。

系数(_cons): 1946.069。这告诉我们当英里/加仑和重量为零时汽车的平均价格。在此示例中,当重量和英里/加仑为零时,平均价格为 1,946 美元。这实际上解释起来没有意义,因为汽车的重量和英里/加仑不能为零,但需要数字 1946.069 才能形成回归方程。

第四步:报告结果。

最后,我们想要报告多元线性回归的结果。以下是如何执行此操作的示例:

进行多元线性回归来量化汽车的重量和英里/加仑及其价格之间的关系。分析中使用了 74 辆汽车的样本。

结果显示,重量和价格之间存在统计显着关系(t = 2.72,p = 0.008),但每加仑英里数和价格(以及每加仑英里数(t = -0.57,p = 0.567)之间不存在统计显着关系。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注