如何在 python 中计算偏度和峰度


在统计学中,偏度峰度是测量分布形状的两种方法。

偏度是分布偏度的度量。该值可以是正值,也可以是负值。

  • 负偏度表示尾部位于分布的左侧,向更多负值延伸。
  • 正偏度表示尾部位于分布的右侧,向更正的值延伸。
  • 值为零表示分布不存在不对称性,这意味着分布完全对称。

峰度是衡量分布与正态分布相比是重尾还是轻尾的指标。

  • 正态分布的峰度为 3。
  • 如果给定分布的峰度小于 3,则称其为playkurtic ,这意味着与正态分布相比,它往往会产生更少且不太极端的异常值。
  • 如果给定分布的峰度大于 3,则称为尖峰分布,这意味着它往往会比正态分布产生更多的异常值。

注意:某些公式(Fisher 定义)会从峰度中减去 3,以便更容易与正态分布进行比较。使用此定义,如果分布的峰度值大于 0,则该分布的峰度将大于正态分布。

本教程介绍如何在 Python 中计算给定数据集的偏度和峰度。

示例:Python 中的偏度和扁平化

假设我们有以下数据集:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

为了计算该数据集的样本偏度和峰度,我们可以使用 Scipy Stata 库中的skew()kurt()函数,语法如下:

  • 偏差(值数组,偏差 = false)
  • kurt(值数组,偏差 = false)

我们使用bias=False参数来计算样本偏度和峰度,而不是总体偏度和峰度。

以下是如何将这些函数用于我们的特定数据集:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

#calculate sample skewness
skew(data, bias= False )

0.032697

#calculate sample kurtosis
kurtosis(data, bias= False )

0.118157

偏度结果为0.032697 ,峰度结果为0.118157

这意味着与正态分布相比,该分布略有正偏,并且尾部有更多值。

附加资源:偏度和峰度计算器

您还可以使用统计偏度和峰度计算器来计算给定数据集的偏度,该计算器会自动计算给定数据集的偏度和峰度。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注