如何在 stata 中创建和解释 qq 图
QQ 图是“分位数-分位数”的缩写,通常用于评估回归分析的残差是否呈正态分布。
本教程介绍如何在 Stata 中创建和解释 QQ 图。
示例:Stata 中的 QQ 图
在本例中,我们将使用 Stata 内置的自动数据集。我们将拟合多元线性回归模型,使用mpg和位移作为解释变量,使用价格作为响应变量。然后,我们将获得模型的残差并创建 QQ 图以查看残差是否服从正态分布。
步骤1:加载并显示数据。
首先,我们将使用以下命令加载数据:
系统自动使用
接下来,我们将使用以下命令快速汇总数据:
总结一下
步骤 2:拟合回归模型。
接下来,我们将使用以下命令来拟合回归模型:
回归价格 mpg 排量
步骤3:计算残差。
回想一下,残差只是预测响应值(通过估计回归方程计算)与实际响应值之间的差值。
我们可以通过使用residuals命令来获得每个预测的残差,并将这些值存储在一个我们想要命名的变量中。在本例中,我们将使用名称resid_price :
预测 Residence_price、残差
第四步:创建QQ图。
现在我们有了残基列表,我们可以使用qnorm命令创建 QQ 图:
qnorm 价格剩余
第五步:解读QQ图。
QQ 图背后的想法很简单:如果残差大致遵循 45 度角的直线,则残差大致呈正态分布。我们可以在上面的 QQ 图中看到,残差往往会稍微偏离 45 度线,尤其是在末端,这可能表明它们不是正态分布的。
虽然 QQ 图不是正式的统计测试,但它提供了一种简单的方法来直观地检查残差是否呈正态分布。
如果结果表明您的残差明显偏离 QQ 图中的 45 度线,您可以考虑对回归中的响应变量进行转换,例如使用响应变量的平方根或对数。
如果残差仅略有偏差,则无需担心响应变量的转换,因为回归对于正态性偏差非常稳健。