四分位数

在本文中,我们解释什么是四分位数。您将找到每个四分位数的定义、如何计算它们以及几个具体示例。我们还向您展示如何计算分组数据的四分位数。此外,您将能够使用在线计算器计算任何数据集的四分位数。

什么是四分位数?

在统计学中,四分位数是将一组有序数据分为四个相等部分的三个值。因此,第一、第二和第三四分位数分别代表所有统计数据的 25%、50% 和 75%。

四分位数由大写 Q 和四分位数索引表示,因此第一个四分位数是 Q 1 ,第二个四分位数是 Q 2 ,第三个四分位数是 Q 3

四分位数

👉您可以使用下面的计算器来计算任何数据集的四分位数。

应该注意的是,四分位数与五分位数、十分位数和百分位数相同,是非中心位置的度量。您可以在此网页上检查每种分位数类型的含义。

第一个四分位数

第一个四分位数,也称为四分位数 1,是样本中统计数据大于 25% 的值。换句话说,第一个四分位数代表超过 25% 的观测数据。

第一个四分位数用符号Q 1表示,用于表示样本中的最小数据值。

第二个四分位数

第二个四分位数,也称为四分位数 2,是大于样本中统计数据 50% 的值。因此,第二个四分位数将数据集分成两半,并与中位数和第五个十分位数重合。

第二个四分位数的符号是 Q2

第三个四分位数

第三四分位数,也称为第三四分位数,是样本中超过 75% 的统计数据的值。换句话说,第三个四分位数代表了所收集数据的 75% 以上。

第三个四分位数用符号Q 3表示,代表样本中的最大值。

如何计算四分位数

计算统计数据集四分位数的位置,必须将四分位数数乘以数据总数加一的总和,然后将结果除以四。

因此,四分位数的公式如下:

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

请注意:这个公式告诉我们四分位数的位置,而不是四分位数的值。四分位数将是位于通过公式获得的位置的数据。

然而,有时这个公式的结果会给我们一个十进制数。因此,我们必须根据结果是否为十进制数来区分两种情况:

  • 如果公式的结果是一个不带小数部分的数字,则四分位数就是上式给出的位置上的数据。
  • 如果公式结果是带小数部分的数字,则使用以下公式计算四分位值:

Q=x_i+d\cdot (x_{i+1}-x_i)

其中x ix i+1为第一个公式得到的数所在位置的数字, d为第一个公式得到的数的小数部分。

现在,也许计算四分位数对您来说非常复杂,因为有很多事情需要考虑。但通过下一节中的两个示例,您将看到它实际上非常简单。

注意:在科学界,对于如何计算四分位数没有达成共识,因此您可以找到一本统计书籍,其解释略有不同。

计算四分位数的示例

要完全理解四分位数的计算方式,您将在下面找到两个已解决的练习。第一个四分位数是整数,第二个四分位数是小数,因此您可以看看可以找到哪两种情况。

实施例1

  • 计算以下数据集的三个四分位数:
排序数据练习

正如我们在上面看到的,确定四分位数的公式是:

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

在这种情况下n ,观测总数为 15,因此我们必须将n替换为 15,将k替换为 1 才能找到第一个四分位数:

\cfrac{1\cdot (15+1)}{4}=4 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_1=39

因此,第一个四分位数是有序值列表中第四个位置的数字,在本例中为 39。

同样,我们将系数k替换为 2 来计算第二个四分位数:

\cfrac{2\cdot (15+1)}{4}=8 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_2=48

因此,四分位数 2 是排序列表中的第八个数字,对应于值 48。

最后,我们最后一次应用k =3 的公式来计算第三个四分位数:

\cfrac{3\cdot (15+1)}{4}=12 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_3=60

四分位数 3 对应于第十二位的数据,即 60。

实施例2

  • 找到以下数据系列的三个四分位数:
练习已解决,数据已排序

在第二个示例中,我们有 24 个观测值,因此从四分位数公式获得的数字将为小数。

我们首先通过将通式中的 1 代入k来计算第一个四分位数的位置:

\cfrac{k\cdot (n+1)}{4}

\cfrac{1\cdot (24+1)}{4}=6,25

但我们得到的小数是 6.25,因此第一个四分位数位于第六和第七个数据之间,分别是 22 和 25。因此,要计算精确的四分位数,我们需要应用以下公式:

Q=x_i+d\cdot (x_{i+1}-x_i)

在这种情况下, x i是22, x i+1 25, d是所获得的数字的小数部分,即0.25。然而:

Q_1=22+0,25\cdot (25-22)=22,75

现在我们执行相同的过程来查找第二个四分位数:

\cfrac{2\cdot (24+1)}{4}=12,5

我们再次从公式中得到一个十进制数,在本例中为 12.5。因此,我们必须对数据表中的第十二和第十三个数字(对应于 49 和 50)使用相同的公式:

Q_2=49+0,5\cdot (50-49)=49,5

最后,我们重复相同的过程来获得第三个四分位数:

\cfrac{3\cdot (24+1)}{4}=18,75

但数字 18.75 位于数字 18 和 19 之间,因此第三个四分位数将位于这些位置的值(71 和 73)之间。更准确地说,这将是我们从以下表达式获得的值:

Q_3=71+0,75\cdot (73-71)=72,5

四分位数计算器

将统计数据集插入下面的计算器以计算四分位数。数据必须用空格分隔,并使用句点作为小数点分隔符输入。

分组数据中的四分位数

在数据按区间分组时计算四分位数,我们首先需要使用以下公式找到四分位数所属的区间或区间:

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

因此,四分位数将位于其绝对累积频率立即大于通过先前表达式获得的数字的区间内。

一旦我们知道了四分位数所属的区间,我们就必须应用以下公式来找到四分位数的精确值:

Q_k=L_i+ \cfrac{\displaystyle\frac{k\cdot (n+1)}{4}-F_{i-1}}{f_i}\cdot I_i \qquad k=1,2,3

金子:

  • Li是四分位数所在区间的下限。
  • n是观测值总数。
  • F i-1是前一个间隔的累积绝对频率。
  • f i是四分位数所在区间的绝对频率。
  • I i是四分位数间隔的宽度。

例如,以下是计算一系列分组数据中的四分位数的练习:

按四分位数分组的数据

要计算第一个四分位数,您必须首先确定它所处的区间。为此,我们应用以下公式:

\cfrac{k\cdot (n+1)}{4}

\cfrac{1\cdot (30+1)}{4} =7,75 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [50,60)

因此,第一个四分位数将位于累积绝对频率立即大于 7.75 的区间内,在本例中,它是累积绝对频率为 15 的区间 [50.60)。一旦我们知道了四分位数区间,我们就可以使用第二个过程公式:

Q_k=L_i+\cfrac{\displaystyle\frac{k\cdot (n+1)}{4}-F_{i-1}}{f_i}\cdot I_i

Q_1=50+\cfrac{\displaystyle\frac{1\cdot (30+1)}{4}-7}{8}\cdot 10=50,94

我们再次应用相同的过程来获得第二个四分位数。我们首先确定四分位数所在的区间:

\cfrac{2\cdot (30+1)}{4} =15,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

累积绝对频率立即大于 15.5 的区间为 [60.70),累积绝对频率为 26。因此,第二个四分位数为:

Q_2=60+\cfrac{\displaystyle\frac{2\cdot (30+1)}{4}-15}{11}\cdot 10=60,45

最后,我们重复这个过程来找到第三个四分位数。我们首先计算包含四分位数的区间:

\cfrac{3\cdot (30+1)}{4} =22,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

紧邻 23.25 之上的累积绝对频率为 26,因此第三个四分位数范围为 [60.70)。因此,我们应用以下公式来计算具有此间隔的四分位数:

Q_3=60+\cfrac{\displaystyle\frac{3\cdot (30+1)}{4}-15}{11}\cdot 10=67,5

四分位数有什么用?

四分位数是位置的度量,因此它们用于了解数据的定位方式。换句话说,三个四分位数的值可以让我们知道样本中的随机数据项是非常大、非常小还是平均值。

如果我们从样本中随机取出一条数据,我们可以通过将其与四分位数进行比较来判断其值是高还是低。如果随机数据值小于第一个四分位数,则该值将是一个小值,但如果其值大于第三个四分位数,则它将是一个大值。同样,如果所述数据的值在第一四分位数和第三四分位数之间,则它是中间值。

另一方面,四分位数还用于计算其他统计度量,例如四分位数范围(或四分位数范围),并用于制作图表,例如箱须图(或箱线图)。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注