如何删除 r 箱线图中的异常值
有时您可能想从 R 箱线图中删除异常值。
本教程解释了如何使用基本 R 和ggplot2来执行此操作。
删除 Base R 箱线图中的异常值
假设我们有以下数据集:
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
以下代码显示了如何在基础 R 中为此数据集创建箱线图:
boxplot(data)
要删除异常值,您可以使用Outline=FALSE参数:
boxplot(data, outline= FALSE )
删除 ggplot2 箱线图中的异常值
假设我们有以下数据集:
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
以下代码展示了如何使用 ggplot2 可视化库创建箱线图:
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()
要删除异常值,您可以使用outlier.shape=NA参数:
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )
请注意,ggplot2 不会自动调整 y 轴。
要调整 y 轴,您可以使用coord_cartesian :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))
y 轴现在的范围从 5 到 30,正如我们使用ylim()参数指定的那样。
其他资源
以下教程解释了如何在ggplot2中执行其他常见操作: