如何在 r 中计算偏度和峰度

经过本杰明·安德森博 27 7 月, 2023 指导 0 条评论

在统计学中，偏度和峰度是测量分布形状的两种方法。

偏度是分布偏度的度量。该值可以是正值，也可以是负值。

峰度是衡量分布与正态分布相比是重尾还是轻尾的指标。

注意：某些公式（Fisher 定义）会从峰度中减去 3，以便更容易与正态分布进行比较。使用此定义，如果分布的峰度值大于 0，则该分布的峰度将大于正态分布。

本教程介绍如何在 R 中计算给定数据集的偏度和峰度。

假设我们有以下数据集：

 data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

我们可以通过创建直方图来快速可视化该数据集中值的分布：

 hist(data, col=' steelblue ')

R 中的偏度和峰度

直方图向我们表明分布似乎向左倾斜。也就是说，较大部分的值集中在分布的右侧。

为了计算该数据集的偏度和峰度，我们可以使用 R 中矩库中的skewness()和kurtosis()函数：

 library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

偏度结果为-1.391777 ，峰度结果为4.177865 。

由于偏度为负，这表明分布是左偏的。这证实了我们在直方图中看到的内容。

由于峰度大于 3，这表明与正态分布相比，该分布尾部有更多值。

moment库还提供jarque.test()函数，该函数执行拟合优度测试，确定样本数据是否表现出与正态分布一致的偏度和峰度。该检验的原假设和备择假设如下：

零假设：数据集具有与正态分布相对应的偏度和峰度。

替代假设：数据集具有不符合正态分布的偏斜和峰度。

以下代码显示了如何执行此测试：

 jarque.test(data)

	Jarque-Bera Normality Test

data:data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

测试的 p 值为0.05756 。由于该值不小于 α = 0.05，因此我们无法拒绝原假设。我们没有足够的证据表明该数据集具有与正态分布不同的偏度和峰度。

您可以在此处找到完整的Moments库文档。

您还可以使用统计偏度和峰度计算器来计算给定数据集的偏度，该计算器会自动计算给定数据集的偏度和峰度。

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多