色散测量

在本文中,您将了解什么是分散度量以及这些统计指标的用途。此外,您将能够看到每个分散度量是如何计算的。

什么是分散措施?

离散度度量是指示数据集离散度的统计度量。也就是说,分散度量用于评估样本中数据的分散程度。

离差测度也称为变异测度扩散测度

分散措施有哪些?

分散措施如下:

  • 标准差(或标准差)
  • 方差
  • 变异系数
  • 整齐的
  • 四分位数范围
  • 中等差异

下面解释如何确定每个分散度量。

标准差

标准差,也称为典型偏差,等于数据系列偏差平方和除以观测总数的平方根。

因此,该分散度量的公式如下:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

请参阅:计算标准差的示例

方差

方差等于观测总数的残差平方和。因此,该色散度量的公式如下:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

金子:

  • X

    是要计算方差的随机变量。

  • x_i

    是数据值

    i

  • n

    是观测值的总数。

  • \overline{X}

    是随机变量的平均值

    X

参见:偏差计算示例

变异系数

在统计学中,变异系数是离散度的度量,用于确定数据集相对于其平均值的离散度。变异系数的计算方法是将数据的标准差除以平均值,然后乘以 100,以百分比形式表示该值。

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

整齐的

极差是离散度的度量,表示样本中数据的最大值和最小值之间的差异。因此,要计算总体或统计样本的范围,必须从最小值中减去最大值。

R=\text{M\'ax}-\text{M\'in}

参见:范围计算示例

四分位数范围

四分位距,也称为四分位距,是统计离散度的度量,表示第三个四分位数和第一个四分位数之间的差异。

因此,要计算统计数据集的四分位距,必须首先找到第三和第一四分位数,然后将它们相减。

IQR=Q_3-Q_1

四分位距的符号是 IQR,源自英语的四分位距

这种离散度测量最有利的特征之一是它是一个稳健的统计量,即它对异常值具有很高的稳健性。由于四分位距的计算中没有考虑极值,因此如果出现新的异常值,其值变化很小。

中等差异

平均偏差,也称为平均绝对偏差,是绝对偏差的平均值。因此,平均偏差等于每个数据项与算术平均值的偏差之和除以数据项总数。

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

色散测量有何用途?

离散度测量用于评估统计样本的离散度。也就是说,离散度测量使我们能够量化数据集的离散度,并且根据获得的值,可以分析数据样本的离散度。

离散度度量被广泛使用,因为它们有助于描述数据样本。离散度测量有助于了解数据系列的样子。

也经常计算的其他统计度量是集中趋势度量和位置度量。通常,不会确定单个统计测量值,而是进行多次测量以更好地了解所研究的数据是什么样的。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注