Come rimuovere gli outlier nei boxplot in r


A volte potresti voler rimuovere i valori anomali dai boxplot in R.

Questo tutorial spiega come farlo utilizzando sia base R che ggplot2 .

Rimuovere i valori anomali nei boxplot in Base R

Supponiamo di avere il seguente set di dati:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

Il codice seguente mostra come creare un boxplot per questo set di dati in base R:

 boxplot(data)

Per rimuovere i valori anomali, puoi utilizzare l’argomento profile=FALSE :

 boxplot(data, outline= FALSE ) 

Boxplot con valore anomalo rimosso in R

Rimuovi i valori anomali nei boxplot in ggplot2

Supponiamo di avere il seguente set di dati:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

Il codice seguente mostra come creare un boxplot utilizzando la libreria di visualizzazione ggplot2:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

Per rimuovere i valori anomali, puoi utilizzare l’argomento outlier.shape=NA :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

boxplot ggplot2 con valori anomali rimossi

Tieni presente che ggplot2 non regola automaticamente l’asse y.

Per regolare l’asse y puoi usare coord_cartesian :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

boxplot ggplot2 senza valori anomali

L’asse y ora varia da 5 a 30, come specificato utilizzando l’argomento ylim() .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in ggplot2:

Come impostare i limiti degli assi in ggplot2
Come creare grafici affiancati in ggplot2
Come etichettare i valori anomali nei boxplot in ggplot2

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *