如何在excel中计算标准化残差


残差回归模型中观测值与预测值之间的差异。

计算方法如下:

残差 = 观测值 – 预测值

如果我们绘制观测值并叠加拟合回归线,则每个观测值的残差将是观测值与回归线之间的垂直距离:

统计中的残差示例

我们经常用来识别回归模型中的异常值的一种残差称为标准化残差

计算方法如下:

r i = e i / s(e i ) = e i / RSE√ 1-h ii

金子:

  • e i :第 i残基
  • RSE:模型的残差标准误差
  • h ii第 i 个观测值的上升

在实践中,我们经常将绝对值大于 3 的任何标准化残差视为异常值。

本教程提供了如何在 Excel 中计算标准化残差的分步示例。

第 1 步:输入数据

首先,我们将小数据集中的值输入到 Excel 中:

第 2 步:计算残差

接下来,我们将导航到顶部功能区的“数据”选项卡,然后单击“分析”组中的“数据分析”

如果您尚未安装此加载项,请查看本教程以了解如何安装。它易于安装且完全免费。

单击“数据分析”后,单击“回归”选项,然后单击“确定” 。在出现的新窗口中,填写以下信息并单击“确定”

每个观测值的残差将出现在结果中:

Excel 中的残差

将这些残差复制并粘贴到原始数据旁边的新列中:

第三步:计算杠杆

接下来,我们需要计算每个观察的杠杆率。

下图显示了如何执行此操作:

利用 Excel 中的计算进行统计

以下是不同单元格中使用的公式:

  • B14: =计数(B2:B13)
  • B15: = 平均 (B2: B13)
  • B16: =DEVSQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

步骤 4:计算标准化残差

最后,我们可以使用以下公式计算标准化残差:

r i = e i / RSE√ 1-h ii

模型的CSR可以在之前模型的结果中找到。结果是4.44

因此,我们可以使用以下公式来计算每个观测值的标准化残差:

Excel 中的标准化残差

从结果中我们可以看到,没有一个标准化残差的绝对值超过 3。因此,没有一个观测值看起来是异常值。

应该指出的是,在某些情况下,研究人员将标准化残差绝对值超过 2 的观测值视为异常值。

您可以根据您正在处理的具体问题来决定是使用绝对值 2 还是 3 作为异常值的阈值。

其他资源

什么是残留物?
什么是标准化残差?
多元线性回归简介

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注