Hoe het gemiddelde te plotten met geom_bar() in ggplot2


U kunt de volgende basissyntaxis gebruiken om gemiddelde waarden per groep uit te zetten met behulp van de functie geom_bar() in ggplot2:

 library (ggplot2)

ggplot(df, aes(group_var, values_var)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Opmerking : het fun- argument in geom_bar() vertelt ggplot2 welke beschrijvende statistiek moet worden weergegeven met behulp van balken. U kunt ook een andere beschrijvende statistiek, zoals ‚mediaan‘, aan dit argument doorgeven om de mediaanwaarde per groep uit te zetten.

Voorbeeld: gemiddelde waarden plotten met geom_bar() in ggplot2

Stel dat we het volgende gegevensframe hebben met informatie over het aantal punten dat is gescoord door basketbalspelers van verschillende teams:

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ),
                 points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8))

#view data frame
df

   team points
1 to 3
2 to 5
3 to 5
4 to 6
5 B 5
6 B 7
7 B 7
8 B 8
9 C 9
10 C 9
11 C 9
12 C 8

We kunnen de volgende syntaxis gebruiken om een staafdiagram te maken waarin elke staaf de gemiddelde puntwaarde vertegenwoordigt, gegroepeerd per team :

 library (ggplot2)

#create bar plot to visualize mean points value by team
ggplot(df, aes(team, points)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ') 

plot het gemiddelde met geom_bar in ggplot2

De hoogte van elke balk vertegenwoordigt de gemiddelde puntenwaarde van elk team .

Om de werkelijke gemiddelde puntwaarde van elk team weer te geven, kunnen we de functie summarise() uit het dplyr- pakket gebruiken:

 library (dplyr)

#calculate mean value of points, grouped by team
df %>%
  group_by(team) %>%
  summarise(mean_pts = mean(points, na. rm = TRUE ))

# A tibble: 3 x 2
  team mean_pts
      
1 to 4.75
2 B 6.75
3 C 8.75

Uit het resultaat kunnen we de gemiddelde puntenwaarde voor elk team zien:

  • Team A: 4.75
  • Team B: 6.75
  • Team C: 8.75

Deze waarden komen overeen met de hoogte van de balken die in het staafdiagram hierboven worden weergegeven.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in ggplot2 kunt uitvoeren:

Hoe de ruimte tussen staven in ggplot2 aan te passen
Hoe NA’s uit een plot in ggplot2 te verwijderen
Hoe u de staafkleuren in het gestapelde Bart-diagram in ggplot2 kunt wijzigen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert