Come creare un boxplot raggruppato in r utilizzando ggplot2
I boxplot sono utili per visualizzare il riepilogo a cinque cifre di un set di dati, che include:
- Minimo
- Il primo quartile
- La mediana
- Il terzo quartile
- Il massimo
Correlato: Una delicata introduzione ai boxplot
Fortunatamente, è facile creare boxplot in R utilizzando la libreria di visualizzazione ggplot2 .
Implica anche la creazione di boxplot raggruppati in base a una particolare variabile in un set di dati. Ad esempio, supponiamo di avere il seguente set di dati che mostra l’aumento di efficienza di 150 giocatori di basket di tre squadre diverse sulla base di due diversi programmi di allenamento:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Possiamo utilizzare il seguente codice per creare boxplot che mostrano l’aumento dell’efficienza dei giocatori, raggruppati per squadra e popolati in base al programma di allenamento:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
Possiamo utilizzare una sintassi simile per creare boxplot che mostrano l’aumento dell’efficienza dei giocatori, raggruppati per programma di allenamento e popolati per squadra:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
Un’alternativa simile consiste nell’utilizzare faceting , in cui ciascun sottogruppo viene visualizzato nel proprio pannello:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
A seconda dei dati con cui stai lavorando, la creazione di facet potrebbe o meno soddisfare le tue esigenze di visualizzazione.
Risorse addizionali
Come rimuovere gli outlier nei boxplot in R
Come creare grafici affiancati in ggplot2
Una guida completa ai migliori temi ggplot2