如何在excel中计算标准化残差
残差是回归模型中观测值与预测值之间的差异。
计算方法如下:
残差 = 观测值 – 预测值
如果我们绘制观测值并叠加拟合回归线,则每个观测值的残差将是观测值与回归线之间的垂直距离:
我们经常用来识别回归模型中的异常值的一种残差称为标准化残差。
计算方法如下:
r i = e i / s(e i ) = e i / RSE√ 1-h ii
金子:
- e i :第 i个残基
- RSE:模型的残差标准误差
- h ii :第 i 个观测值的上升
在实践中,我们经常将绝对值大于 3 的任何标准化残差视为异常值。
本教程提供了如何在 Excel 中计算标准化残差的分步示例。
第 1 步:输入数据
首先,我们将小数据集中的值输入到 Excel 中:
第 2 步:计算残差
接下来,我们将导航到顶部功能区的“数据”选项卡,然后单击“分析”组中的“数据分析” :
如果您尚未安装此加载项,请查看本教程以了解如何安装。它易于安装且完全免费。
单击“数据分析”后,单击“回归”选项,然后单击“确定” 。在出现的新窗口中,填写以下信息并单击“确定” :
每个观测值的残差将出现在结果中:
将这些残差复制并粘贴到原始数据旁边的新列中:
第三步:计算杠杆
接下来,我们需要计算每个观察的杠杆率。
下图显示了如何执行此操作:
以下是不同单元格中使用的公式:
- B14: =计数(B2:B13)
- B15: = 平均 (B2: B13)
- B16: =DEVSQ(B2:B13)
- E2: =1/$B$14+(B2-$B$15)^2/$B$16
步骤 4:计算标准化残差
最后,我们可以使用以下公式计算标准化残差:
r i = e i / RSE√ 1-h ii
模型的CSR可以在之前模型的结果中找到。结果是4.44 :
因此,我们可以使用以下公式来计算每个观测值的标准化残差:
从结果中我们可以看到,没有一个标准化残差的绝对值超过 3。因此,没有一个观测值看起来是异常值。
应该指出的是,在某些情况下,研究人员将标准化残差绝对值超过 2 的观测值视为异常值。
您可以根据您正在处理的具体问题来决定是使用绝对值 2 还是 3 作为异常值的阈值。