范围对比标准差:何时使用每个标准差
极差和标准差是衡量数据集中值分布的两种方法。
范围表示数据集中的最小值和最大值之间的差异。
标准差衡量的是单个值与平均值的典型偏差。计算方法如下:
s = √(Σ(x i – x ) 2 / (n-1))
金子:
- Σ:表示“和”的符号
- x i :样本中第 i 个观测值的值
- x :样本平均值
- n:样本量
例如,假设我们有以下数据集:
数据集: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
范围计算如下:31 -1 = 32。
我们可以用计算器算出标准差是9.25。
极差和标准差:异同
极差和标准差有以下相似之处:
- 这两个指标都衡量数据集中值的分布。
但极差和标准差有以下区别:
- 极差告诉我们数据集中最大值和最小值之间的差异。
- 标准差告诉我们单个值与数据集平均值的典型偏差。
范围对比标准差:何时使用每个标准差
当我们想要了解数据集中的最大值和最小值之间的差异时,我们需要使用范围。
例如,假设一位教授给 100 名学生进行考试。她可以使用该量表来了解班上所有学生取得的最高分和最低分之间的差异。
相反,当我们想要了解数据集的典型值与平均值的偏差程度时,应该使用标准差。
例如,如果教授对 100 名学生进行考试,他或她可以使用标准差来量化典型考试分数与平均考试分数的偏差程度。
值得注意的是,我们不必在使用范围或标准差来描述数据集中值的分布之间进行选择。我们可以使用这两个指标,因为它们为我们提供了完全不同的信息。
极差和标准差的缺点
极差和标准差都有一个缺点:它们都受到异常值的影响。
为了说明这一点,请考虑以下数据集:
数据集: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
我们可以计算该数据集的范围和标准差的以下值:
- 范围: 31
- 标准差: 9.25
但是,请考虑数据集是否存在极端异常值:
数据集: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32、378
我们可以使用计算器找到该数据集的以下指标:
- 范围: 377
- 标准差: 85.02
请注意范围和标准差如何因异常值而显着变化。
尽管极差和标准差可以作为了解数据集中值分布的有用度量,但您必须首先确保数据集不包含影响这些值的任何异常值。措施。否则,范围和标准差可能会产生误导。