变异性措施

本文解释了什么是变异性度量以及这些类型的统计度量的用途。因此,您将找到变异性度量的定义、变异性度量的不同类型以及变异性度量的计算方式。

什么是变异性度量?

变异性度量是指示数据集变异性的统计度量。换句话说,变异性度量衡量数据系列的分散度。

因此,变异性度量用于了解样本中值的离散程度。变异性度量的值越高,意味着样本中的数据彼此之间的距离越远。一般来说,数据样本彼此接近非常重要,因此我们通常会尽量减少变异性测量。

在统计学中,变异性度量很重要,因为它们使我们能够了解数据集上的集中度量的代表性。如果变异性度量的值较低,则意味着数据非常集中,因此集中化度量可以很好地描述整个数据。

变异性测度也可称为离散度测度扩散测度

变异性的衡量标准是什么?

变异性测量如下:

  • 标准差(或标准差)
  • 方差
  • 变异系数
  • 整齐的
  • 四分位数范围
  • 中等差异

下面解释了如何计算每种类型的变异性度量

标准差

标准差,也称为典型偏差,等于数据系列偏差平方和除以观测总数的平方根。

因此,这种变异性度量的公式如下:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

方差

方差等于观测总数的残差平方和。因此,该变异性指标的公式如下:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

金子:

  • X

    是要计算方差的随机变量。

  • x_i

    是数据值

    i

  • n

    是观测值的总数。

  • \overline{X}

    是随机变量的平均值

    X

变异系数

在统计学中,变异系数是变异性的度量,用于确定数据集相对于其平均值的离散度。变异系数的计算方法是用数据的标准差除以平均值,然后乘以 100,以百分比形式表示该值。

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

整齐的

范围是变异性的度量,指示样本中数据的最大值和最小值之间的差异。因此,要计算总体或统计样本的范围,必须从最小值中减去最大值。

R=\text{M\'ax}-\text{M\'in}

参见:极差计算实例

四分位数范围

四分位距,也称为四分位距,是统计变异性的度量,指示第三和第一四分位数之间的差异。

因此,要计算统计数据集的四分位距,必须首先找到第三和第一四分位数,然后将它们相减。

IQR=Q_3-Q_1

四分位距的符号是 IQR,源自英语的四分位距

这种变异性度量最有利的特征之一是它是一种稳健的统计量,也就是说,它对异常值具有很高的稳健性。由于四分位距的计算中没有考虑极值,因此如果出现新的异常值,其值变化很小。

中等差异

平均偏差,也称为平均绝对偏差,是绝对偏差的平均值。因此,平均偏差等于每个数据项与算术平均值的偏差之和除以数据项总数。

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注