如何在 stata 中进行简单线性回归
简单线性回归是一种可用于理解解释变量 x 和响应变量 y 之间关系的方法。
本教程介绍如何在 Stata 中执行简单的线性回归。
示例:Stata 中的简单线性回归
假设我们想了解汽车的重量和每加仑行驶里程之间的关系。为了探索这种关系,我们可以使用重量作为解释变量,每加仑英里数作为响应变量来执行简单的线性回归。
在 Stata 中完成以下步骤,使用名为auto的数据集执行简单的线性回归,该数据集包含 74 辆不同汽车的数据。
第 1 步:加载数据。
通过在命令框中键入以下内容来加载数据:
使用https://www.stata-press.com/data/r13/auto
步骤 2:获取数据摘要。
通过在命令框中键入以下内容,可以快速了解您正在使用的数据:
总结一下
我们可以看到数据集中有 12 个不同的变量,但我们唯一关心的两个是mpg和 Weight 。
第 3 步:可视化数据。
在执行简单的线性回归之前,我们首先创建一个体重与英里/加仑的散点图,以便我们可以可视化这两个变量之间的关系并检查明显的异常值。在命令框中键入以下命令以创建散点图:
英里/加仑重量分布
这会产生以下散点图:
我们可以看到,重量较高的汽车每加仑行驶的英里数往往较少。为了量化这种关系,我们现在将执行一个简单的线性回归。
步骤 4:执行简单线性回归。
在命令框中键入以下内容,以使用体重作为解释变量、mpg 作为响应变量来执行简单线性回归。
将体重回归为英里/加仑
以下是如何解释结果中最有趣的数字:
R 平方: 0.6515。这是可以由解释变量解释的响应变量方差的比例。在此示例中,65.15% 的 mpg 变化可以通过重量来解释。
系数(重量): -0.006。这告诉我们与解释变量增加一单位相关的响应变量的平均变化。在此示例中,重量每增加一磅,平均就会减少 0.006 英里/加仑。
系数(_cons): 39.44028。这告诉我们当解释变量为零时响应变量的平均值。在此示例中,当汽车重量为零时,平均英里/加仑为 39.44028。这实际上没有任何意义,因为汽车的重量不可能为零,但数字 39.44028 对于形成回归方程是必要的。
P>|t| (重量): 0.000。这是与体重检验统计量相关的 p 值。在这种情况下,由于该值小于 0.05,因此我们可以得出结论,体重和 mpg 之间存在统计上显着的关系。
回归方程:最后,我们可以使用两个系数值形成回归方程。在这种情况下,方程为:
预测英里/加仑 = 39.44028 – 0.0060087*(体重)
我们可以使用这个方程来计算汽车在给定重量的情况下的预期英里数。例如,一辆重 4,000 磅的汽车的 mpg 应该为 15,405:
预测英里/加仑 = 39.44028 – 0.0060087*(4000) = 15.405
第五步:报告结果。
最后,我们想要报告简单线性回归的结果。以下是如何执行此操作的示例:
进行线性回归来量化汽车重量和每加仑行驶里程之间的关系。分析中使用了 74 辆汽车的样本。
结果显示,体重和 mpg 之间存在统计显着关系 (t = -11.60,p < 0.0001),并且体重占 mpg 解释变异的 65.15%。
回归方程为:
预计 mpg = 39.44 – 0.006(体重)
每增加一磅,平均每加仑就会减少 -0.006 英里。