Comment dessiner des boxplots avec des valeurs moyennes dans R (avec exemples)



Vous pouvez utiliser les méthodes suivantes pour dessiner une boîte à moustaches avec une valeur moyenne dans R :

Méthode 1 : utiliser Base R

#create boxplots
boxplot(df$values~df$group)

#calculate mean value by group
means <- tapply(df$values, df$group, mean)

#add means as circles to each boxplot
points(means, pch=20) 

Méthode 2 : utilisez ggplot2

library(ggplot2)

#create boxplots with mean values shown as circles
ggplot(df, aes(x=group, y=values, fill=group)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom='point', shape=20)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=rep(c('A', 'B', 'C'), each=5),
                 points=c(4, 4, 5, 6, 8, 7, 6, 8, 9, 12,
                          11, 12, 13, 16, 18))

#view first six rows of data frame
head(df)

  team points
1    A      4
2    A      4
3    A      5
4    A      6
5    A      8
6    B      7

Exemple 1 : Créer des boîtes à moustaches avec des valeurs moyennes en base R

Le code suivant montre comment créer des boxplots avec des valeurs moyennes en base R :

#create boxplots
boxplot(df$points~df$team)

#calculate mean value by group
means <- tapply(df$points, df$team, mean)

#add means as circles to each boxplot
points(means, pch=20, cex=1.5)

Les lignes noires à l’intérieur de chaque boîte à moustaches représentent la valeur médiane et les cercles noirs à l’intérieur de chaque boîte à moustaches représentent la valeur moyenne .

Remarque : Modifiez la valeur de l’argument cex pour modifier la taille du cercle.

Exemple 2 : Créer des boxplots avec des valeurs moyennes dans ggplot2

Le code suivant montre comment créer des boxplots avec des valeurs moyennes dans ggplot2 :

library(ggplot2)

#create boxplots with mean values
ggplot(df, aes(x=team, y=points, fill=team)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom='point', shape=20, size=8) +
  theme(legend.position='none')

boîte à moustaches avec valeur moyenne dans R

Les lignes noires à l’intérieur de chaque boîte à moustaches représentent la valeur médiane et les cercles noirs à l’intérieur de chaque boîte à moustaches représentent la valeur moyenne .

Remarque : modifiez la valeur de l’argument size dans la fonction stat_summary() pour modifier la taille du cercle.

Ressources additionnelles

Les didacticiels suivants offrent des informations supplémentaires sur les boxplots :

Quand devriez-vous utiliser une boîte à moustaches ? (3 scénarios)
Comment identifier l’asymétrie dans les boîtes à moustaches
Comment comparer les boîtes à moustaches

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *