Comment créer un boxplot groupé dans R à l’aide de ggplot2



Les boxplots sont utiles pour visualiser le résumé à cinq chiffres d’un ensemble de données, qui comprend :

  • Le minimum
  • Le premier quartile
  • La médiane
  • Le troisième quartile
  • Le maximum

Connexes : Une introduction douce aux boxplots

Heureusement, il est facile de créer des boxplots dans R à l’aide de la bibliothèque de visualisation ggplot2 .

Il s’agit également de créer des boxplots regroupés par une variable particulière dans un ensemble de données. Par exemple, supposons que nous ayons l’ensemble de données suivant qui affiche l’augmentation de l’efficacité de 150 joueurs de basket-ball de trois équipes différentes sur la base de deux programmes d’entraînement différents :

#define variables
team=rep(c('A', 'B', 'C'), each=50)
program=rep(c('low', 'high'), each=25)
increase=seq(1:150)+sample(1:100, 100, replace=TRUE)

#create dataset using variables
data=data.frame(team, program, increase)

#view first six rows of dataset 
head(data)

  team program increase
1    A     low       62
2    A     low       37
3    A     low       49
4    A     low       60
5    A     low       64
6    A     low      105

Nous pouvons utiliser le code suivant pour créer des boxplots qui affichent l’augmentation de l’efficacité des joueurs, regroupés par équipe et renseignés en fonction du programme d’entraînement :

library(ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot()

Boxplot groupé dans R

Nous pouvons utiliser une syntaxe similaire pour créer des boxplots qui affichent l’augmentation de l’efficacité des joueurs, regroupés par programme d’entraînement et renseignés en fonction de l’équipe :

library(ggplot2)

ggplot(data, aes(x=program, y=increase, fill=team)) + 
  geom_boxplot()

Boxplot groupé dans R

Une alternative similaire consiste à utiliser le facettage , dans lequel chaque sous-groupe est affiché dans son propre panneau :

library(ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot() +
  facet_wrap(~program)

Boxplots dans R regroupés par facette

Selon les données avec lesquelles vous travaillez, la création de facettes peut ou non répondre à vos besoins de visualisation.

Ressources additionnelles

Comment supprimer les valeurs aberrantes dans les boxplots dans R
Comment créer des tracés côte à côte dans ggplot2
Un guide complet des meilleurs thèmes ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *