五分位数(统计)

在本文中,我们将解释什么是五分位数以及它们的计算方法。您将找到几个计算五分位数的已解决示例,此外,您还可以使用在线计算器计算任何统计样本的五分位数。

什么是五分位数?

在统计学中,五分位数是将数据集分为五个相等部分的四个值。因此,第一、第二、第三和第四五分位数分别代表样本数据的 20%、40%、60% 和 80%。

也就是说,例如,第三个五分位数的值高于收集的所有数据的 60%,但低于其余数据。

五分位数的符号是带有五分位数索引的大写字母K,即第一五分位数为K 1 ,第二五分位数为K 2 ,第三五分位数为K 3 ,第四五分位数为K 4 。尽管它也可以用字母 Q 表示(不推荐,因为它会与四分位数产生混淆)。

五分位数

👉您可以使用下面的计算器计算任何数据集的五分位数。

五分位数与四分位数、十分位数和百分位数一起衡量非中心位置。如果您更感兴趣,您可以在我们的网站上查看每种分位数类型的含义。

应该注意的是,五分位数可能有其他定义。在经济学中,五分位数代表按收入排序的人口百分比,或者换句话说,它们按收入水平对人口进行排名。例如,第一个五分位数对应于人口中最贫困的 20% 人口,第二个五分位数对应于收入最低的 40% 人口,依此类推。

如何计算五分位数

计算样本或统计总体的五分位数的位置,必须将五分位数的数量乘以数据总数加一的总和,然后将结果除以五。

因此,五分位数的公式为:

\cfrac{k\cdot (n+1)}{5} \qquad k=1, 2, 3,4

请注意:这个公式的结果告诉我们五分位数的位置,而不是它的值。因此,五分位数将是位于通过公式获得的位置处的数据。

然而,有时这个公式的结果会给我们一个十进制数,因此我们必须根据结果是否是十进制数来区分两种情况:

  • 如果公式的结果是一个不带小数部分的数字,则五分位数就是位于上式所提供位置的数据。
  • 如果公式结果是带小数部分的数字,则使用以下表达式计算五分位数值:

K=x_i+d\cdot (x_{i+1}-x_i)

其中x ix i+1为第一个公式得到的数所在位置的数字, d为第一个公式得到的数的小数部分。

如果您在看到确定数据集五分位数的这么多步骤时感到害怕,请不要担心,它实际上非常简单。读完下面两个例子,你一定会明白很多。

注意:统计界对于五分位数的计算方式仍然没有完全达成一致,因此您可能会找到一本对其解释略有不同的书。

计算五分位数的示例

下面我们给您留下两个练习,逐步解决如何从数据系列中获取五分位数。因此,您可以看到两种可能的情况,在第一个练习中,结果不是十进制的,而在第二个练习中,结果是十进制的。

实施例1

  • 计算以下数据系列的五分位数:
有序数据

正如您在上面的解释中看到的,查找五分位数位置的公式是:

\cfrac{k\cdot (n+1)}{5} \qquad k=1, 2, 3,4

参数n指的是数据总数,为49,因此要找到第一个五分位数的位置,我们需要将n替换为49,将k替换为1:

\cfrac{1\cdot (49+1)}{5}=10 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad K_1=205

从公式中我们得到数字10,这意味着五分位数位于有序列表的第十位置,对应于数据205。

要计算第二个五分位数,您必须使用相同的公式,但将k替换为 2:

\cfrac{2\cdot (49+1)}{5}=20 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad K_2=236

因此,第二个五分位数位于有序列表的位置号 20,即值 236。

我们再次重复该过程来确定五分位数 3,但从逻辑上讲,我们现在将k替换为 3:

\cfrac{3\cdot (49+1)}{5}=30 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad K_3=266

因此,第三个五分位数是位于位置 30 的数据,对应于 266。

最后,我们再次应用公式来计算第四个五分位数:

\cfrac{4\cdot (49+1)}{5}=40 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad K_4=286

因此,第四个五分位数位于位置 40,因此第四个五分位数是 286。

实施例2

  • 计算下表中收集的统计数据的四个五分位数:。
样本数据

与前面的示例相同,要获取五分位数的位置,必须使用以下公式:

\cfrac{k\cdot (n+1)}{5} \qquad k=1, 2, 3,4

在本例中,样本大小为 42 个观测值,因此为了找到第一个五分位数的位置,我们需要将参数n替换为 42,将k替换为 1:

\cfrac{1\cdot (42+1)}{5}=8,6

然而,与第一个示例不同的是,这次公式给我们提供的是十进制数,因此我们需要应用以下公式来计算精确的五分位数:

K=x_i+d\cdot (x_{i+1}-x_i)

从第一个公式得到的数字是8.6,因此第一个五分位数位于第八和第九个数据之间,分别是78和79。因此, x i为78, x i+1为79, d为所得数的小数部分,即0.6。

K_1=78+0,6\cdot (79-78)=78,6

现在我们再次执行完全相同的过程来找到第二个五分位数。我们首先计算它的位置:

\cfrac{2\cdot (42+1)}{5}=17,2

但从公式中我们得到了 17 到 18 之间的十进制数,这样第二个五分位数将位于第 17 和第 18 个位置之间,其值分别对应于有序列表的 109 和 112。因此,我们在过程中应用第二个公式来确定精确的五分位值:

K_2=109+0,2\cdot (112-109)=109,6

我们重复该方法获得第三个五分位数,我们首先确定它的位置:

\cfrac{3\cdot (42+1)}{5}=25,8

计算出的数字 25.8 意味着五分位值将在第 25 位和第 26 位之间,其值为 134 和 141。因此,精确的五分位值的计算为:

K_3=134+0,8\cdot (141-134)=139,6

最后,我们最后一次重复相同的过程来计算五分位数 4。我们首先找到它的位置:

\cfrac{4\cdot (42+1)}{5}=34,4

因此,第四个五分位数的精确值将在 34 和 35 之间,其位置对应于数据 172 和 179。因此,第四个五分位数的计算为:

K_4=172+0,4\cdot (179-172)=174,8

五分位数计算器

在以下计算器中输入统计数据集以计算五分位数。数据必须用空格分隔,并使用句点作为小数点分隔符输入。

分组数据中的五分位数

在数据按区间分组时计算五分位数,必须首先使用以下公式找到其区间或类别:

\cfrac{k\cdot (n+1)}{5} \qquad k=1, 2, 3,4

因此,五分位数将位于其绝对频率立即大于通过先前表达式获得的数字的区间内。

一旦我们知道了五分位数所属的区间,我们就必须应用以下公式来找到五分位数的精确值:

K_k=L_i+ \cfrac{\displaystyle\frac{k\cdot (n+1)}{5}-F_{i-1}}{f_i}\cdot I_i \qquad k=1,2,3,4

金子:

  • Li是五分位数所在区间的下限。
  • n是观测值总数。
  • F i-1是前一个间隔的累积绝对频率。
  • f i是五分位数所在区间的绝对频率。
  • I i是五分位数间隔的宽度。

因此,您可以看到这是如何完成的,这是一个计算以下数据系列的五分位数(按区间分组)的已解决示例:

分组为区间的数据集

由于数据是分组的,所以我们必须使用以下方法来计算五分位数:首先确定五分位数所处的范围,然后找到五分位数的精确值。

因此,为了找到第一个五分位数所在的区间,我们使用以下公式:

\cfrac{k\cdot (n+1)}{5}

\cfrac{1\cdot (150+1)}{5} =30,2 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [150,200)

第一个五分位数将位于累积绝对频率立即大于 30.2 的区间内,在本例中,它是累积绝对频率为 42 的区间 [150,200)。 一旦我们知道了五分位数区间,我们就应用第二个公式确定其准确值的过程:

K_k=L_i+ \cfrac{\displaystyle\frac{k\cdot (n+1)}{5}-F_{i-1}}{f_i}\cdot I_i

K_1=150+\cfrac{\displaystyle\frac{1\cdot (150+1)}{5}-18}{24}\cdot 50=175,42

现在我们重复相同的过程来获得第二个五分位数,首先计算它所在的区间:

\cfrac{2\cdot (150+1)}{5} =60,4 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [200,250)

紧邻 60.4 的累积绝对频率为 75,因此第二个五分位数范围为 [200 250)。因此,我们将对应的值代入第二个公式即可计算出精确的五分位数值:

K_2=200+\cfrac{\displaystyle\frac{2\cdot (150+1)}{5}-42}{33}\cdot 50=227,88

我们第三次执行相同的过程以获得五分位数 3。我们首先确定五分位数所在的区间:

\cfrac{3\cdot (150+1)}{5} =90,6 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [250,300)

五分位数位于区间 [250,300) 中,因为其累积绝对频率 (102) 紧邻 90.6 以上。因此,第三个五分位数的精确值的计算如下:

K_3=250+\cfrac{\displaystyle\frac{3\cdot (150+1)}{5}-75}{27}\cdot 50=278,89

最后,我们将找到第四个五分位数。一如既往,我们首先找到它的区间:

\cfrac{4\cdot (150+1)}{5} =120,8 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [300,350)

绝对频率立即大于 120.8 的区间是 [300.350),其值为 130。因此,第四个五分位数的精确值为:

K_4=300+\cfrac{\displaystyle\frac{4\cdot (150+1)}{5}-102}{28}\cdot 50=333,57

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注