箱线图
箱线图(有时称为箱须图)是显示一组数据的五数摘要的图。
五数概括包括:
- 最低限度
- 第一个四分位数
- 中位数
- 第三个四分位数
- 最大值
箱线图使我们能够使用简单的图轻松可视化数据集中值的分布。
如何创建箱线图
为了创建箱线图,我们从第一四分位数到第三四分位数绘制一个箱线。接下来,我们在中线处画一条垂直线。最后,我们绘制四分位数的“须线”,直到最小值和最大值。
假设我们有以下数据集,显示十种植物的高度:
要创建箱线图,我们需要找到最小值、第一四分位数、中位数、第三四分位数和最大值。
步骤一:将数据从小到大整理。
10, 11, 12, 12, 13, 14, 16, 19, 20, 24
步骤 2:求中位数。
在本例中,它是中间两个数字的平均值:
10, 11, 12, 12, 13, 14 , 16, 19, 20, 24
中位数 = (13 + 14) / 2 = 13.5
步骤 3:找到底部四分位数 (Q1) 和顶部四分位数 (Q3)。
下四分位数是中位数左侧数字的中位数。在本例中,时间是 12 点。
10, 11, 12 , 12, 13 , 14, 16, 19, 20, 24
上四分位数是中位数右侧数字的中位数。在本例中,时间是晚上 7 点。
10, 11, 12, 12, 13, 14, 16, 19 , 20, 24
第四步:找到最小值和最大值。
最小值为 10,最大值为 24。
10、11、12、12、13、14、16、19、20、24 _
第 5 步:使用五数汇总绘制箱线图。
为什么箱线图有用?
箱线图很有用,因为它们可以帮助我们可视化数据集的五个重要的描述性统计数据:最小值、下四分位数、中位数、上四分位数和最大值。
箱线图还可以帮助我们轻松回答以下问题:
平均株高是多少?
为了回答这个问题,我们可以寻找框内指示中位数的垂直线。在本例中,它是 13.5 英寸。
最高的植物有多高?
为了回答这个问题,我们可以寻找右边胡须末端指示最大值的点。在本例中,它是 24 英寸。
有多少植物的高度超过 19 英寸?
为了回答这个问题,我们可以看到上四分位数(Q3)等于 19。回想一下,上四分位数代表第 75 个百分位数,这意味着 75% 的值等于或小于 19。
这意味着 25% 的值大于 19。因此,25% 的植物大于 19 英寸。
如何使用不同的软件创建箱线图
以下教程提供了有关如何使用不同软件创建箱形图的分步示例:
如何在 Excel 中创建箱线图
如何在 Google 表格中创建箱线图
如何在 SPSS 中创建箱线图
如何在 Stata 中创建箱线图
在线箱线图生成器