Como remover outliers em boxplots em r
Às vezes você pode querer remover valores discrepantes de boxplots em R.
Este tutorial explica como fazer isso usando base R e ggplot2 .
Remover valores discrepantes em boxplots na Base R
Suponha que temos o seguinte conjunto de dados:
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
O código a seguir mostra como criar um boxplot para este conjunto de dados na base R:
boxplot(data)
Para remover valores discrepantes, você pode usar o argumento outline=FALSE :
boxplot(data, outline= FALSE )
Remova valores discrepantes em boxplots no ggplot2
Suponha que temos o seguinte conjunto de dados:
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
O código a seguir mostra como criar um boxplot usando a biblioteca de visualização ggplot2:
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()
Para remover valores discrepantes, você pode usar o argumento outlier.shape=NA :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )
Observe que o ggplot2 não ajusta automaticamente o eixo y.
Para ajustar o eixo y você pode usar coord_cartesian :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))
O eixo y agora varia de 5 a 30, conforme especificamos usando o argumento ylim() .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns no ggplot2:
Como definir limites de eixo no ggplot2
Como criar gráficos lado a lado no ggplot2
Como rotular outliers em boxplots no ggplot2