形状测量

本文解释什么是形状测量。因此,您将了解形状指标的用途、如何解释形状指标以及如何计算这些类型的统计指标。

什么是形状测量?

在统计学中,形状度量是允许我们根据形状描述概率分布的指标。也就是说,形状度量用于确定分布的外观,而无需将其绘制成图表。

形状测量有两种类型:偏度和峰度。偏度表示分布的对称程度,而峰度表示分布在均值附近的集中程度。

形状测量有哪些?

考虑到形状度量的定义,本节显示这些类型的统计参数是什么。

在统计学中,我们区分两种形式的度量:

  • 偏度:表示分布是对称的还是不对称的。
  • 峰度– 指示分布是陡峭还是平坦。

不对称

不对称性可分为三种类型

  • 正不对称:分布在均值右侧的不同值多于在其左侧的值。
  • 对称性:分布在均值左侧和均值右侧具有相同数量的值。
  • 负偏度:分布在均值左侧的不同值多于在其右侧的值。
不对称的类型

不对称系数

偏度系数不对称指数是一种统计系数,有助于确定分布的不对称性。因此,通过计算不对称系数,可以知道分布的不对称类型,而无需对其进行图形表示。

尽管计算不对称系数有不同的公式,我们将在下面看到它们,但无论使用哪种公式,不对称系数的解释始终如下:

  • 如果偏度系数为正,则分布呈正偏态
  • 如果偏度系数为零,则分布是对称的
  • 如果偏度系数为负,则分布呈负偏态
Fisher 不对称系数

Fisher 偏度系数等于均值的三阶矩除以样本标准差。因此, Fisher不对称系数的计算公式为:

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

等效地,可以使用以下两个公式中的任意一个来计算Fisher系数:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

金子

E

是数学期望,

\mu

算术平均值,

\sigma

标准差和

N

数据总数。

另一方面,如果数据已分组,则可以使用以下公式:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

在这种情况下哪里

x_i

它是阶级的标志

f_i

课程的绝对频率。

皮尔逊不对称系数

皮尔逊偏度系数等于样本均值与众数之差除以其标准差(或标准差)。因此,皮尔逊不对称系数的公式如下:

A_p=\cfrac{\mu-Mo}{\sigma}

金子

A_p

是皮尔逊系数,

\mu

算术平均值,

Mo

时尚和

\sigma

标准差。

请记住,只有在单峰分布(即数据中只有一种众数)的情况下,才能计算皮尔逊偏度系数。

鲍利不对称系数

鲍利偏度系数等于第三个四分位数加上第一个四分位数之和减去中位数的两倍除以第三个四分位数和第一个四分位数之间的差。因此,该不对称系数的公式如下:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

金子

Q_1

Q_3

分别是第一和第三四分位数

Me

是分布的中位数。

扁平化

峰度,也称为偏度,表示分布在其均值周围的集中程度。换句话说,峰度表示分布是陡峭还是平坦。具体来说,分布的峰度越大,它就越陡(或越尖锐)。

谄媚

奉承有三种类型

  • Leptokurtic :分布非常尖锐,也就是说数据强烈集中在均值附近。更准确地说,尖峰分布被定义为比正态分布更尖锐的分布。
  • 中峰:分布的峰度相当于正态分布的峰度。因此,它既不被认为是尖的,也不被认为是扁平的。
  • Platicurtic :分布非常平坦,也就是说平均值附近的集中度较低。形式上,峰态分布被定义为比正态分布更平坦的分布。

请注意,不同类型的峰度是以正态分布的峰度为参考来定义的。

奉承的类型

扁平系数

峰度系数的计算公式如下:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

频率表中分组数据的峰度系数公式:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

最后,按区间分组的数据的峰度系数公式:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

金子:

  • g_2

    是峰度系数。

  • N

    是数据总数。

  • x_i

    是该系列中的第 i 个数据。

  • \mu

    是分布的算术平均值。

  • \sigma

    是分布的标准偏差(或典型偏差)。

  • f_i

    是 it 数据集的绝对频率。

  • c_i

    是第i组的班级标志。

请注意,在所有峰度系数公式中,都减去 3,因为它是正态分布的峰度值。因此,峰度系数的计算是以正态分布的峰度为参考来进行的。这就是为什么有时在统计学中会计算出过度峰度

计算出峰度系数后,必须对其进行如下解释,以确定峰度的类型:

  • 如果峰度系数为正,则表示分布是尖峰的
  • 如果峰度系数为零,则意味着分布是中峰态的
  • 如果峰度系数为负,则表示分布是平峰的

其他类型的统计措施

您可能还对以下任何统计指标感兴趣,单击其中一项即可查看它们是什么以及如何计算。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注