箱线图


箱线图(有时称为箱须图)是显示一组数据的五数摘要的图。

五数概括包括:

  • 最低限度
  • 第一个四分位数
  • 中位数
  • 第三个四分位数
  • 最大值

箱线图使我们能够使用简单的图轻松可视化数据集中值的分布。

如何创建箱线图

为了创建箱线图,我们从第一四分位数到第三四分位数绘制一个箱线。接下来,我们在中线处画一条垂直线。最后,我们绘制四分位数的“须线”,直到最小值和最大值。

假设我们有以下数据集,显示十种植物的高度:


要创建箱线图,我们需要找到最小值、第一四分位数、中位数、第三四分位数和最大值。

步骤一:将数据从小到大整理。

10, 11, 12, 12, 13, 14, 16, 19, 20, 24

步骤 2:求中位数。

在本例中,它是中间两个数字的平均值:

10, 11, 12, 12, 13, 14 , 16, 19, 20, 24

中位数 = (13 + 14) / 2 = 13.5

步骤 3:找到底部四分位数 (Q1) 和顶部四分位数 (Q3)。

下四分位数是中位数左侧数字的中位数。在本例中,时间是 12 点。

10, 11, 12 , 12, 13 , 14, 16, 19, 20, 24

上四分位数是中位数右侧数字的中位数。在本例中,时间是晚上 7 点。

10, 11, 12, 12, 13, 14, 16, 19 , 20, 24

第四步:找到最小值和最大值。

最小值为 10,最大值为 24。

10、11、12、12、13、14、16、19、20、24 _

第 5 步:使用五数汇总绘制箱线图。

为什么箱线图有用?

箱线图很有用,因为它们可以帮助我们可视化数据集的五个重要的描述性统计数据:最小值、下四分位数、中位数、上四分位数和最大值。

箱线图还可以帮助我们轻松回答以下问题:

平均株高是多少?

为了回答这个问题,我们可以寻找框内指示中位数的垂直线。在本例中,它是 13.5 英寸。

最高的植物有多高?

为了回答这个问题,我们可以寻找右边胡须末端指示最大值的点。在本例中,它是 24 英寸。

有多少植物的高度超过 19 英寸?

为了回答这个问题,我们可以看到上四分位数(Q3)等于 19。回想一下,上四分位数代表第 75 个百分位数,这意味着 75% 的值等于或小于 19。

这意味着 25% 的值大于 19。因此,25% 的植物大于 19 英寸。

如何使用不同的软件创建箱线图

以下教程提供了有关如何使用不同软件创建箱形图的分步示例:

如何在 Excel 中创建箱线图
如何在 Google 表格中创建箱线图
如何在 SPSS 中创建箱线图
如何在 Stata 中创建箱线图
在线箱线图生成器

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注