Comment tracer la moyenne et l’écart type dans ggplot2



Souvent, vous souhaiterez peut-être tracer la moyenne et l’écart type par groupe dans ggplot2.

Heureusement, cela est facile à faire en utilisant les fonctions geom_point() et geom_errorbar() dans ggplot2.

L’exemple suivant montre comment utiliser ces fonctions pour créer le graphique suivant qui montre la moyenne et l’écart type des points marqués par différentes équipes de basket-ball :

tracer la moyenne et l'écart type dans ggplot2

Exemple : tracer la moyenne et l’écart type dans ggplot2

Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur le nombre de points marqués par les basketteurs de trois équipes différentes :

#create data frame
df <- data.frame(team=rep(c('A', 'B', 'C'), each=6),
                 points=c(8, 10, 12, 12, 14, 15, 10, 11, 12,
                          18, 22, 24, 3, 5, 5, 6, 7, 9))

#view head of data frame
head(df)

  team points
1    A      8
2    A     10
3    A     12
4    A     12
5    A     14
6    A     15

Nous pouvons utiliser les fonctions du package dplyr pour calculer rapidement la moyenne et l’écart type des points marqués par les joueurs de chaque équipe :

library(dplyr)

#calculate mean and sd of points by team
df_mean_std <- df %>%
  group_by(team) %>%
  summarise_at(vars(points), list(mean=mean, sd=sd)) %>% 
  as.data.frame()

#view results
df_mean_std

  team      mean       sd
1    A 11.833333 2.562551
2    B 16.166667 6.013873
3    C  5.833333 2.041241

Enfin, nous pouvons utiliser les fonctions suivantes de ggplot2 pour visualiser la moyenne et l’écart type des points marqués par les joueurs de chaque équipe :

library(ggplot2)

#plot mean and standard deviation of points by team
ggplot(df_mean_std , aes(x=team, y=mean)) + 
  geom_errorbar(aes(ymin=mean-sd, ymax=mean+sd), width=.3) +
  geom_point(size=2)

tracer la moyenne et l'écart type dans ggplot2

Le graphique résultant montre la moyenne et l’écart type des points marqués par les joueurs de chaque équipe.

Les cercles représentent les valeurs moyennes et la longueur des barres au-dessus et en dessous de chaque cercle représente l’écart type.

Remarque : L’argument width dans la fonction geom_errorbar() spécifie la largeur des barres d’erreur. N’hésitez pas à modifier cette valeur pour ajuster la largeur des barres d’erreur dans le tracé.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans ggplot2 :

Comment ajouter une légende aux tracés ggplot2
Comment changer la taille de la police dans ggplot2
Comment supprimer une légende dans ggplot2
Comment faire pivoter les étiquettes des axes dans ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *