如何在stata中进行层次回归

经过本杰明·安德森博 29 7 月, 2023 指导 0 条评论

分层回归是一种我们可以用来比较几种不同线性模型的技术。

基本思想是我们首先用单个解释变量拟合线性回归模型。接下来，我们使用附加解释变量拟合另一个回归模型。如果第二个模型中的 R 平方（响应变量中可由解释变量解释的方差比例）显着高于前一个模型中的 R 平方，则意味着第二个模型更好。

然后，我们重复使用更多解释变量拟合其他回归模型的过程，看看新模型是否比以前的模型有所改进。

本教程提供了如何在 Stata 中执行层次回归的示例。

我们将使用一个名为auto 的内置数据集来说明如何在 Stata 中执行层次回归。首先，通过在命令框中键入以下内容来加载数据集：

系统自动使用

我们可以使用以下命令快速汇总数据：

总结一下

Stata 中的自动数据集摘要

我们可以看到该数据集总共包含 74 辆汽车的 12 个不同变量的信息。

我们将拟合以下三个线性回归模型，并使用层次回归来查看每个后续模型是否比之前的模型提供了显着的改进：

模型1：价格=拦截+英里/加仑

模型2：价格=截距+英里/加仑+重量

模型3：价格=截距+英里/加仑+重量+齿轮比

为了在 Stata 中执行层次回归，我们首先需要安装Hireg软件包。为此，请在命令框中键入以下内容：

找到希雷格

在出现的窗口中，单击https://fmwww.bc.edu/RePEc/bocode/h 中的 Hireg

在Stata中安装Hireg包

在下一个窗口中，单击显示“单击此处安装”的链接。

该软件包将在几秒钟内安装。然后，要执行层次回归，我们将使用以下命令：

租赁价格（英里/加仑）（重量）（齿轮比）

这就是 Stata 要做的事情：

这是第一个模型的结果：

Stata 中的分层回归输出

我们看到模型的 R 平方为0.2196 ，模型的总体 p 值 (Prob > F) 为0.0000 ，在 α = 0.05 时具有统计显着性。

接下来我们看第二个模型的结果：

Stata中第二个模型的层次回归输出

该模型的 R 方为0.2934 ，比第一个模型的 R 方大。为了确定这种差异是否具有统计显着性，Stata 进行了 F 检验，结果底部给出了以下数字：

由于 p 值小于 0.05，我们得出结论，与第一个模型相比，第二个模型在统计上有显着的改进。

最后我们可以看到第三个模型的结果：

Stata解释中的层次回归

该模型的 R 方为0.3150 ，比第二个模型的 R 方大。为了确定这种差异是否具有统计显着性，Stata 进行了 F 检验，结果底部给出了以下数字：

由于 p 值不小于 0.05，因此我们没有足够的证据表明第三个模型比第二个模型有所改进。

在结果的最后，我们可以看到Stata提供了结果摘要：

Stata 中的层次回归结果

在这个特定示例中，我们得出的结论是，模型 2 比模型 1 提供了显着改进，但模型 3 并没有比模型 2 提供显着改进。

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多