百分位数、四分位数和分位数:有什么区别?
学生在统计学中经常混淆的三个术语是百分位数、四分位数和分位数。
以下是每个的简单定义:
百分位数:范围从 0 到 100。
四分位数:范围从 0 到 4。
分位数:从任何值到任何其他值。
请注意,百分位数和四分位数只是分位数的类型。
某些类型的分位数甚至有特定的名称,包括:
- 4 个分位数称为四分位数。
- 这 5 个分位数称为五分位数。
- 8 个分位数称为八分位数。
- 这 10 个分位数称为十分位数。
- 这 100 个分位数称为百分位数。
请注意,百分位数和四分位数具有以下关系:
- 0 个百分位数 = 0 个四分位数(也称为最小值)
- 第 25 个百分位数 = 第一个四分位数
- 第 50 个百分位数 = 第二个四分位数(也称为中位数)
- 第 75 个百分位数 = 第三个四分位数
- 第 100 个百分位数 = 第四个四分位数(也称为最大值)
示例:查找百分位数和四分位数
假设我们有以下包含 20 个值的数据集:
使用统计软件(如Excel、R、Python等),我们可以找到该数据集的以下百分位数和四分位数:
以下是如何解释这些值:
- 百分位数 0 和四分位数 0 是3 。
- 第 25 个百分位数和第一个四分位数是8.5 。
- 第 50 个百分位数和第二个四分位数是16.5 。
- 第 75 个百分位数和第 3 个四分位数是23.5 。
- 第 100 个百分位数和第 4 个四分位数是37 。
何时使用百分位数与四分位数
百分位数可用于回答以下问题:
学生需要在特定测试中取得多少分数才能进入前 10%?
为了回答这个问题,我们需要找到所有分数的第 90 个百分位数,该值是将排名后 90% 的分数与排名前 10% 的分数分开的值。
某所学校学生平均身高的 40% 是多少?
为了回答这个问题,我们需要找到身高的第 70 个百分位数和身高的第 30 个百分位数,这两个值决定了中间 40% 身高的上限和下限。
四分位数可用于回答以下问题:
学生需要在考试中取得多少分数才能进入前四分之一的分数?
为了回答这个问题,我们需要找到所有分数的第三个四分位数,该值是将最低的 75% 与最高的 25% 分开的值。
给定数据集的四分位数范围是多少?
四分位距 (IQR) 是中间 50% 的数据值的范围。要找到给定数据集的 IQR,我们可以计算第三个四分位数 – 第一个四分位数。
其他资源
如何在 R 中计算百分位数
如何在 R 中计算四分位数
如何在 Excel 中计算四分位距
如何在 TI-84 计算器上计算四分位数范围