如何在 stata 中创建和解释 qq 图


QQ 图是“分位数-分位数”的缩写,通常用于评估回归分析的残差是否呈正态分布。

本教程介绍如何在 Stata 中创建和解释 QQ 图。

示例:Stata 中的 QQ 图

在本例中,我们将使用 Stata 内置的自动数据集。我们将拟合多元线性回归模型,使用mpg位移作为解释变量,使用价格作为响应变量。然后,我们将获得模型的残差并创建 QQ 图以查看残差是否服从正态分布。

步骤1:加载并显示数据。

首先,我们将使用以下命令加载数据:

系统自动使用

接下来,我们将使用以下命令快速汇总数据:

总结一下

总结Stata中的顺序

步骤 2:拟合回归模型。

接下来,我们将使用以下命令来拟合回归模型:

回归价格 mpg 排量

Stata 中的回归模型输出

步骤3:计算残差

回想一下,残差只是预测响应值(通过估计回归方程计算)与实际响应值之间的差值。

我们可以通过使用residuals命令来获得每个预测的残差,并将这些值存储在一个我们想要命名的变量中。在本例中,我们将使用名称resid_price

预测 Residence_price、残差

第四步:创建QQ图。

现在我们有了残基列表,我们可以使用qnorm命令创建 QQ 图:

qnorm 价格剩余

Stata 中的 QQ 图

第五步:解读QQ图。

QQ 图背后的想法很简单:如果残差大致遵循 45 度角的直线,则残差大致呈正态分布。我们可以在上面的 QQ 图中看到,残差往往会稍微偏离 45 度线,尤其是在末端,这可能表明它们不是正态分布的。

虽然 QQ 图不是正式的统计测试,但它提供了一种简单的方法来直观地检查残差是否呈正态分布。

如果结果表明您的残差明显偏离 QQ 图中的 45 度线,您可以考虑对回归中的响应变量进行转换,例如使用响应变量的平方根或对数。

如果残差仅略有偏差,则无需担心响应变量的转换,因为回归对于正态性偏差非常稳健。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注