色散测量
在本文中,您将了解什么是分散度量以及这些统计指标的用途。此外,您将能够看到每个分散度量是如何计算的。
什么是分散措施?
离散度度量是指示数据集离散度的统计度量。也就是说,分散度量用于评估样本中数据的分散程度。
离差测度也称为变异测度或扩散测度。
分散措施有哪些?
分散措施如下:
- 标准差(或标准差)
- 方差
- 变异系数
- 整齐的
- 四分位数范围
- 中等差异
下面解释如何确定每个分散度量。
标准差
标准差,也称为典型偏差,等于数据系列偏差平方和除以观测总数的平方根。
因此,该分散度量的公式如下:
方差
方差等于观测总数的残差平方和。因此,该色散度量的公式如下:
金子:
-
是要计算方差的随机变量。
-
是数据值
。
-
是观测值的总数。
-
是随机变量的平均值
。
变异系数
在统计学中,变异系数是离散度的度量,用于确定数据集相对于其平均值的离散度。变异系数的计算方法是将数据的标准差除以平均值,然后乘以 100,以百分比形式表示该值。
整齐的
极差是离散度的度量,表示样本中数据的最大值和最小值之间的差异。因此,要计算总体或统计样本的范围,必须从最小值中减去最大值。
四分位数范围
四分位距,也称为四分位距,是统计离散度的度量,表示第三个四分位数和第一个四分位数之间的差异。
因此,要计算统计数据集的四分位距,必须首先找到第三和第一四分位数,然后将它们相减。
四分位距的符号是 IQR,源自英语的四分位距。
这种离散度测量最有利的特征之一是它是一个稳健的统计量,即它对异常值具有很高的稳健性。由于四分位距的计算中没有考虑极值,因此如果出现新的异常值,其值变化很小。
中等差异
平均偏差,也称为平均绝对偏差,是绝对偏差的平均值。因此,平均偏差等于每个数据项与算术平均值的偏差之和除以数据项总数。
色散测量有何用途?
离散度测量用于评估统计样本的离散度。也就是说,离散度测量使我们能够量化数据集的离散度,并且根据获得的值,可以分析数据样本的离散度。
离散度度量被广泛使用,因为它们有助于描述数据样本。离散度测量有助于了解数据系列的样子。
也经常计算的其他统计度量是集中趋势度量和位置度量。通常,不会确定单个统计测量值,而是进行多次测量以更好地了解所研究的数据是什么样的。