Comment créer un boxplot groupé dans R à l’aide de ggplot2
Les boxplots sont utiles pour visualiser le résumé à cinq chiffres d’un ensemble de données, qui comprend :
- Le minimum
- Le premier quartile
- La médiane
- Le troisième quartile
- Le maximum
Connexes : Une introduction douce aux boxplots
Heureusement, il est facile de créer des boxplots dans R à l’aide de la bibliothèque de visualisation ggplot2 .
Il s’agit également de créer des boxplots regroupés par une variable particulière dans un ensemble de données. Par exemple, supposons que nous ayons l’ensemble de données suivant qui affiche l’augmentation de l’efficacité de 150 joueurs de basket-ball de trois équipes différentes sur la base de deux programmes d’entraînement différents :
#define variables team=rep(c('A', 'B', 'C'), each=50) program=rep(c('low', 'high'), each=25) increase=seq(1:150)+sample(1:100, 100, replace=TRUE) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Nous pouvons utiliser le code suivant pour créer des boxplots qui affichent l’augmentation de l’efficacité des joueurs, regroupés par équipe et renseignés en fonction du programme d’entraînement :
library(ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot()
Nous pouvons utiliser une syntaxe similaire pour créer des boxplots qui affichent l’augmentation de l’efficacité des joueurs, regroupés par programme d’entraînement et renseignés en fonction de l’équipe :
library(ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot()
Une alternative similaire consiste à utiliser le facettage , dans lequel chaque sous-groupe est affiché dans son propre panneau :
library(ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot() + facet_wrap(~program)
Selon les données avec lesquelles vous travaillez, la création de facettes peut ou non répondre à vos besoins de visualisation.
Ressources additionnelles
Comment supprimer les valeurs aberrantes dans les boxplots dans R
Comment créer des tracés côte à côte dans ggplot2
Un guide complet des meilleurs thèmes ggplot2