如何在 r 中查找和可视化四分位数
四分位数是将数据集分为四个相等部分的值。
- 第一个四分位数表示数据集的第 25 个百分位数。
- 第二个四分位数表示数据集的第 50 个百分位数。该值相当于数据集的 中值。
- 第三个四分位数代表数据集的第 75 个百分位数。
我们可以使用quantile()函数轻松计算 R 中给定数据集的四分位数。
本教程提供了如何在实践中使用此功能的示例。
在 R 中计算四分位数
以下代码显示了如何在 R 中计算给定数据集的四分位数:
#define dataset data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33) #calculate quartiles of dataset quantile(data) 0% 25% 50% 75% 100% 4.0 13.5 16.0 24.5 33.0
以下是如何解释结果:
- 第一个值显示数据集中的最小值: 4.0
- 第二个值显示数据集的第一个四分位数: 13.5
- 第三个值显示数据集的第二个四分位数: 16.0
- 第四个值显示数据集的第三个四分位数: 24.5
- 第五个值显示数据集中的最大值: 33.0
在 R 中可视化四分位数
我们可以使用boxplot()函数创建箱线图来可视化 R 中该数据集的四分位数:
#create boxplot
boxplot(data)
以下是解释箱线图的方法:
- 底部“晶须”显示最小值4 。
- 框的底行显示第一个四分位数值13.5 。
- 框中间的黑条显示第二个四分位数值16.0 。
- 框的顶行显示第三个四分位数值24.5 。
- 上方的“晶须”显示最大值33.0 。
这个独特的图可以帮助我们快速可视化数据集中值的分布。