如何在 python 中计算偏度和峰度
在统计学中,偏度和峰度是测量分布形状的两种方法。
偏度是分布偏度的度量。该值可以是正值,也可以是负值。
- 负偏度表示尾部位于分布的左侧,向更多负值延伸。
- 正偏度表示尾部位于分布的右侧,向更正的值延伸。
- 值为零表示分布不存在不对称性,这意味着分布完全对称。
峰度是衡量分布与正态分布相比是重尾还是轻尾的指标。
- 正态分布的峰度为 3。
- 如果给定分布的峰度小于 3,则称其为playkurtic ,这意味着与正态分布相比,它往往会产生更少且不太极端的异常值。
- 如果给定分布的峰度大于 3,则称为尖峰分布,这意味着它往往会比正态分布产生更多的异常值。
注意:某些公式(Fisher 定义)会从峰度中减去 3,以便更容易与正态分布进行比较。使用此定义,如果分布的峰度值大于 0,则该分布的峰度将大于正态分布。
本教程介绍如何在 Python 中计算给定数据集的偏度和峰度。
示例:Python 中的偏度和扁平化
假设我们有以下数据集:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
为了计算该数据集的样本偏度和峰度,我们可以使用 Scipy Stata 库中的skew()和kurt()函数,语法如下:
- 偏差(值数组,偏差 = false)
- kurt(值数组,偏差 = false)
我们使用bias=False参数来计算样本偏度和峰度,而不是总体偏度和峰度。
以下是如何将这些函数用于我们的特定数据集:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
偏度结果为0.032697 ,峰度结果为0.118157 。
这意味着与正态分布相比,该分布略有正偏,并且尾部有更多值。
附加资源:偏度和峰度计算器
您还可以使用统计偏度和峰度计算器来计算给定数据集的偏度,该计算器会自动计算给定数据集的偏度和峰度。