Comment dessiner des boxplots avec des valeurs moyennes dans R (avec exemples)
Vous pouvez utiliser les méthodes suivantes pour dessiner une boîte à moustaches avec une valeur moyenne dans R :
Méthode 1 : utiliser Base R
#create boxplots boxplot(df$values~df$group) #calculate mean value by group means <- tapply(df$values, df$group, mean) #add means as circles to each boxplot points(means, pch=20)
Méthode 2 : utilisez ggplot2
library(ggplot2)
#create boxplots with mean values shown as circles
ggplot(df, aes(x=group, y=values, fill=group)) +
geom_boxplot() +
stat_summary(fun=mean, geom='point', shape=20)
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant dans R :
#create data frame
df <- data.frame(team=rep(c('A', 'B', 'C'), each=5),
points=c(4, 4, 5, 6, 8, 7, 6, 8, 9, 12,
11, 12, 13, 16, 18))
#view first six rows of data frame
head(df)
team points
1 A 4
2 A 4
3 A 5
4 A 6
5 A 8
6 B 7
Exemple 1 : Créer des boîtes à moustaches avec des valeurs moyennes en base R
Le code suivant montre comment créer des boxplots avec des valeurs moyennes en base R :
#create boxplots boxplot(df$points~df$team) #calculate mean value by group means <- tapply(df$points, df$team, mean) #add means as circles to each boxplot points(means, pch=20, cex=1.5)
Les lignes noires à l’intérieur de chaque boîte à moustaches représentent la valeur médiane et les cercles noirs à l’intérieur de chaque boîte à moustaches représentent la valeur moyenne .
Remarque : Modifiez la valeur de l’argument cex pour modifier la taille du cercle.
Exemple 2 : Créer des boxplots avec des valeurs moyennes dans ggplot2
Le code suivant montre comment créer des boxplots avec des valeurs moyennes dans ggplot2 :
library(ggplot2) #create boxplots with mean values ggplot(df, aes(x=team, y=points, fill=team)) + geom_boxplot() + stat_summary(fun=mean, geom='point', shape=20, size=8) + theme(legend.position='none')
Les lignes noires à l’intérieur de chaque boîte à moustaches représentent la valeur médiane et les cercles noirs à l’intérieur de chaque boîte à moustaches représentent la valeur moyenne .
Remarque : modifiez la valeur de l’argument size dans la fonction stat_summary() pour modifier la taille du cercle.
Ressources additionnelles
Les didacticiels suivants offrent des informations supplémentaires sur les boxplots :
Quand devriez-vous utiliser une boîte à moustaches ? (3 scénarios)
Comment identifier l’asymétrie dans les boîtes à moustaches
Comment comparer les boîtes à moustaches