如何删除 r 箱线图中的异常值


有时您可能想从 R 箱线图中删除异常值。

本教程解释了如何使用基本 R 和ggplot2来执行此操作。

删除 Base R 箱线图中的异常值

假设我们有以下数据集:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

以下代码显示了如何在基础 R 中为此数据集创建箱线图:

 boxplot(data)

要删除异常值,您可以使用Outline=FALSE参数:

 boxplot(data, outline= FALSE ) 

R 中删除异常值的箱线图

删除 ggplot2 箱线图中的异常值

假设我们有以下数据集:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

以下代码展示了如何使用 ggplot2 可视化库创建箱线图:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

要删除异常值,您可以使用outlier.shape=NA参数:

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

删除异常值的 ggplot2 箱线图

请注意,ggplot2 不会自动调整 y 轴。

要调整 y 轴,您可以使用coord_cartesian

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

没有异常值的箱线图 ggplot2

y 轴现在的范围从 5 到 30,正如我们使用ylim()参数指定的那样。

其他资源

以下教程解释了如何在ggplot2中执行其他常见操作:

如何在ggplot2中设置轴限制
如何在 ggplot2 中创建并排图
如何在 ggplot2 箱线图中标记异常值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注