Comment tracer la moyenne avec geom_bar() dans ggplot2



Vous pouvez utiliser la syntaxe de base suivante pour tracer les valeurs moyennes par groupe à l’aide de la fonction geom_bar() dans ggplot2 :

library(ggplot2)

ggplot(df, aes(group_var, values_var)) +
  geom_bar(position='dodge', stat='summary', fun='mean')

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Remarque : L’argument fun dans geom_bar() indique à ggplot2 quelle statistique descriptive afficher à l’aide de barres. Vous pouvez également transmettre une statistique descriptive différente, telle que « médiane », à cet argument pour tracer la valeur médiane par groupe.

Exemple : tracer les valeurs moyennes avec geom_bar() dans ggplot2

Supposons que nous disposions du bloc de données suivant contenant des informations sur le nombre de points marqués par les basketteurs de différentes équipes :

#create data frame
df <- data.frame(team=rep(c('A', 'B', 'C'), each=4),
                 points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8))

#view data frame
df

   team points
1     A      3
2     A      5
3     A      5
4     A      6
5     B      5
6     B      7
7     B      7
8     B      8
9     C      9
10    C      9
11    C      9
12    C      8

Nous pouvons utiliser la syntaxe suivante pour créer un graphique à barres dans lequel chaque barre représente la valeur moyenne des points , regroupés par équipe :

library(ggplot2)

#create bar plot to visualize mean points value by team
ggplot(df, aes(team, points)) +
  geom_bar(position='dodge', stat='summary', fun='mean')

tracer la moyenne avec geom_bar dans ggplot2

La hauteur de chaque barre représente la valeur moyenne des points de chaque équipe .

Pour afficher la valeur moyenne réelle des points de chaque équipe, nous pouvons utiliser la fonction summarise() du package dplyr :

library(dplyr)

#calcualte mean value of points, grouped by team
df %>%
  group_by(team) %>%
  summarise(mean_pts = mean(points, na.rm=TRUE))

# A tibble: 3 x 2
  team  mean_pts
      
1 A         4.75
2 B         6.75
3 C         8.75

À partir du résultat, nous pouvons voir la valeur moyenne des points pour chaque équipe :

  • Équipe A : 4,75
  • Équipe B : 6,75
  • Équipe C : 8,75

Ces valeurs correspondent à la hauteur des barres affichées dans le graphique à barres ci-dessus.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans ggplot2 :

Comment ajuster l’espace entre les barres dans ggplot2
Comment supprimer les NA du tracé dans ggplot2
Comment changer les couleurs des barres dans le graphique Bart empilé dans ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *