如何在 excel 中计算修改后的 z 分数
在统计学中,修改后的 z 分数计算如下:
修改后的 z 分数 = 0.6745 (x i – x̃) / MAD
金子:
- x i :单个数据值
- x̃:数据集的中位数
- MAD:数据集的中值绝对偏差
修改后的 z 分数比常规 z 分数更稳健,因为它在公式中使用中位数而不是均值,众所周知,均值会受到异常值的影响。
Iglewicz 和 Hoaglin建议将修改后的 z 分数小于 -3.5 或大于 3.5 的值标记为潜在异常值。
以下分步示例演示如何计算 Excel 中给定数据集的修改 z 分数。
第 1 步:创建数据
首先,我们将创建以下包含 16 个值的数据集:
第 2 步:计算中位数
接下来,我们将计算数据集的中位数:
结果中位数是16 。
步骤3:计算每个值与中位数之间的绝对差
接下来,我们将计算每个值与中位数之间的绝对差:
第一个数据值与中位数之间的绝对差为 16。
接下来,单击单元格 B2。然后将鼠标悬停在单元格的右下角,直到出现一个小十字 ( + )。
双击叉号将此公式复制并粘贴到该列中的所有剩余单元格中:
步骤 4:计算绝对中值偏差
接下来,我们将使用以下公式来计算数据集的中值绝对偏差:
绝对中位偏差结果为8 。
步骤 5:找到每个数据值的修改后的 Z 分数
最后,我们可以使用以下公式计算每个数据值的修改后的 z 分数:
修改后的 z 分数 = 0.6745 (x i – x̃) / MAD
例如,第一个数据值的修改后的 z 分数计算如下:
接下来,单击单元格 C2。然后将鼠标悬停在单元格的右下角,直到出现一个小十字 ( + )。
双击十字,将此公式复制并粘贴到该列中的所有剩余单元格中:
我们可以看到数据集中没有值的修改后 z 分数小于 -3.5 或大于 3.5,因此我们不会将此数据集中的任何值标记为潜在的异常值。
如何处理异常值
如果您的数据集中存在异常值,您有多种选择:
- 确保异常值不是数据输入错误的结果。有时,个人在保存数据时只是输入了错误的数据值。如果存在异常值,请首先验证输入的值是否正确并且没有错误。
- 为异常值指定一个新值。如果异常值是数据输入错误的结果,您可以决定为其分配一个新值,例如数据集的平均值或中位数。
- 删除异常值。如果该值确实是异常值,并且会对您的整体分析产生重大影响,则您可以选择将其删除。请务必在最终报告或分析中提及您删除了异常值。