如何在 r 中查找和可视化四分位数


四分位数是将数据集分为四个相等部分的值。

  • 第一个四分位数表示数据集的第 25 个百分位数。
  • 第二个四分位数表示数据集的第 50 个百分位数。该值相当于数据集的 中值
  • 第三个四分位数代表数据集的第 75 个百分位数。

我们可以使用quantile()函数轻松计算 R 中给定数据集的四分位数。

本教程提供了如何在实践中使用此功能的示例。

在 R 中计算四分位数

以下代码显示了如何在 R 中计算给定数据集的四分位数:

 #define dataset
data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33)

#calculate quartiles of dataset
quantile(data)

  0% 25% 50% 75% 100% 
 4.0 13.5 16.0 24.5 33.0 

以下是如何解释结果:

  • 第一个值显示数据集中的最小值: 4.0
  • 第二个值显示数据集的第一个四分位数: 13.5
  • 第三个值显示数据集的第二个四分位数: 16.0
  • 第四个值显示数据集的第三个四分位数: 24.5
  • 第五个值显示数据集中的最大值: 33.0

相关:如何在 R 中轻松计算百分位数

在 R 中可视化四分位数

我们可以使用boxplot()函数创建箱线图来可视化 R 中该数据集的四分位数:

 #create boxplot
boxplot(data)

在 R 中可视化四分位数

以下是解释箱线图的方法:

  • 底部“晶须”显示最小值4
  • 框的底行显示第一个四分位数值13.5
  • 框中间的黑条显示第二个四分位数值16.0
  • 框的顶行显示第三个四分位数值24.5
  • 上方的“晶须”显示最大值33.0

这个独特的图可以帮助我们快速可视化数据集中值的分布。

相关:如何在 R 中的单个图表中绘制多个箱线图

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注