如何在 excel 中计算修改后的 z 分数


在统计学中,修改后的 z 分数计算如下:

修改后的 z 分数 = 0.6745 (x i – x̃) / MAD

金子:

  • x i单个数据值
  • x̃:数据集的中位数
  • MAD:数据集的中值绝对偏差

修改后的 z 分数比常规 z 分数更稳健,因为它在公式中使用中位数而不是均值,众所周知,均值会受到异常值的影响

Iglewicz 和 Hoaglin建议将修改后的 z 分数小于 -3.5 或大于 3.5 的值标记为潜在异常值。

以下分步示例演示如何计算 Excel 中给定数据集的修改 z 分数。

第 1 步:创建数据

首先,我们将创建以下包含 16 个值的数据集:

第 2 步:计算中位数

接下来,我们将计算数据集的中位数:

结果中位数是16

步骤3:计算每个值与中位数之间的绝对差

接下来,我们将计算每个值与中位数之间的绝对差:

第一个数据值与中位数之间的绝对差为 16。

接下来,单击单元格 B2。然后将鼠标悬停在单元格的右下角,直到出现一个小十字 ( + )。

双击叉号将此公式复制并粘贴到该列中的所有剩余单元格中:

步骤 4:计算绝对中值偏差

接下来,我们将使用以下公式来计算数据集的中值绝对偏差:

绝对中位偏差结果为8

步骤 5:找到每个数据值的修改后的 Z 分数

最后,我们可以使用以下公式计算每个数据值的修改后的 z 分数:

修改后的 z 分数 = 0.6745 (x i – x̃) / MAD

例如,第一个数据值的修改后的 z 分数计算如下:

Excel 中修改后的 z 分数

接下来,单击单元格 C2。然后将鼠标悬停在单元格的右下角,直到出现一个小十字 ( + )。

双击十字,将此公式复制并粘贴到该列中的所有剩余单元格中:

我们可以看到数据集中没有值的修改后 z 分数小于 -3.5 或大于 3.5,因此我们不会将此数据集中的任何值标记为潜在的异常值。

如何处理异常值

如果您的数据集中存在异常值,您有多种选择:

  • 确保异常值不是数据输入错误的结果。有时,个人在保存数据时只是输入了错误的数据值。如果存在异常值,请首先验证输入的值是否正确并且没有错误。
  • 为异常值指定一个新值。如果异常值是数据输入错误的结果,您可以决定为其分配一个新值,例如数据集的平均值或中位数
  • 删除异常值。如果该值确实是异常值,并且会对您的整体分析产生重大影响,则您可以选择将其删除。请务必在最终报告或分析中提及您删除了异常值。

其他资源

如何在 Excel 中计算 Z 分数
如何在 Excel 中计算四分位距 (IQR)
如何在 Excel 中计算中值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注