完整指南:如何报告偏度和扁平化
在统计学中,偏度和峰度是测量分布形状的两种方法。
偏度是分布偏度的度量。该值可以是正值,也可以是负值。
- 负偏度表示尾部位于分布的左侧,向更多负值延伸。
- 正偏度表示尾部位于分布的右侧,向更正的值延伸。
- 值为零表示分布不存在不对称性,这意味着分布完全对称。
峰度是衡量分布与正态分布相比是重尾还是轻尾的指标。
- 正态分布的峰度为 3。
- 如果给定分布的峰度小于 3,则称其为playkurtic ,这意味着与正态分布相比,它往往会产生更少且不太极端的异常值。
- 如果给定分布的峰度大于 3,则称为尖峰分布,这意味着它往往会比正态分布产生更多的异常值。
注意:某些公式(Fisher 定义)会从峰度中减去 3,以便更容易与正态分布进行比较。使用此定义,如果分布的峰度值大于 0,则该分布的峰度将大于正态分布。
当我们以正式文本报告给定分布的偏度和峰度时,我们通常使用以下格式:
发现[变量名称]的偏度为-0.89,表明分布呈左偏态。
发现[变量名称]的峰度为 4.26,表明该分布的尾部比正态分布更重。
报告结果时请记住以下几点:
- 将偏度和峰度值四舍五入到小数点后两位。
- 报告值时去掉前导0(例如使用0.79,而不是0.79)
以下示例展示了如何在实践中使用此格式。
示例:报告偏度和扁平化
假设我们分析某所大学学生的考试成绩分布。
使用统计软件,我们计算分布的偏度和峰度值:
- 不对称性: -1.391777
- 峰度: 4.170865
我们将报告这些值如下:
考试成绩的偏度为 -1.39,表明分布呈左偏态。
发现考试成绩的峰度为 4.17,表明分布比正态分布更重。
除了报告这些偏度和峰度值之外,我们通常还包含一个图表来可视化值的分布,例如直方图或箱线图,以便读者也可以直观地了解分布情况。
其他资源
以下教程解释了如何在不同的统计软件中计算偏度和峰度:
如何计算 R 中的偏斜和峰度
如何在 Python 中计算偏斜和峰度
如何在 Google 表格中计算偏斜和峰度
以下教程解释了如何报告其他统计结果: