Come rimuovere gli outlier nei boxplot in r
A volte potresti voler rimuovere i valori anomali dai boxplot in R.
Questo tutorial spiega come farlo utilizzando sia base R che ggplot2 .
Rimuovere i valori anomali nei boxplot in Base R
Supponiamo di avere il seguente set di dati:
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
Il codice seguente mostra come creare un boxplot per questo set di dati in base R:
boxplot(data)
Per rimuovere i valori anomali, puoi utilizzare l’argomento profile=FALSE :
boxplot(data, outline= FALSE )
Rimuovi i valori anomali nei boxplot in ggplot2
Supponiamo di avere il seguente set di dati:
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
Il codice seguente mostra come creare un boxplot utilizzando la libreria di visualizzazione ggplot2:
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()
Per rimuovere i valori anomali, puoi utilizzare l’argomento outlier.shape=NA :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )
Tieni presente che ggplot2 non regola automaticamente l’asse y.
Per regolare l’asse y puoi usare coord_cartesian :
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))
L’asse y ora varia da 5 a 30, come specificato utilizzando l’argomento ylim() .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni in ggplot2:
Come impostare i limiti degli assi in ggplot2
Come creare grafici affiancati in ggplot2
Come etichettare i valori anomali nei boxplot in ggplot2