Hoe gemiddelde en standaardafwijking in ggplot2 te plotten
Vaak wilt u misschien het gemiddelde en de standaarddeviatie per groep in ggplot2 plotten.
Gelukkig is dit eenvoudig te doen met behulp van de functies geom_point() en geom_errorbar() in ggplot2.
Het volgende voorbeeld laat zien hoe u deze functies kunt gebruiken om de volgende grafiek te maken die de gemiddelde en standaardafwijking weergeeft van de punten die door verschillende basketbalteams zijn gescoord:
Voorbeeld: gemiddelde en standaardafwijking uitzetten in ggplot2
Stel dat we het volgende dataframe in R hebben dat informatie bevat over het aantal punten dat is gescoord door basketbalspelers uit drie verschillende teams:
#create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 6 ),
points=c(8, 10, 12, 12, 14, 15, 10, 11, 12,
18, 22, 24, 3, 5, 5, 6, 7, 9))
#view head of data frame
head(df)
team points
1 to 8
2 to 10
3 to 12
4 to 12
5 to 14
6 to 15
We kunnen functies in het dplyr- pakket gebruiken om snel de gemiddelde en standaardafwijking te berekenen van de punten die door spelers in elk team worden gescoord:
library (dplyr)
#calculate mean and sd of points by team
df_mean_std <- df %>%
group_by(team) %>%
summarise_at(vars(points), list(mean=mean, sd=sd)) %>%
as. data . frame ()
#view results
df_mean_std
team mean sd
1 A 11.833333 2.562551
2 B 16.166667 6.013873
3 C 5.833333 2.041241
Ten slotte kunnen we de volgende ggplot2- functies gebruiken om de gemiddelde en standaardafwijking van de punten gescoord door spelers in elk team te visualiseren:
library (ggplot2)
#plot mean and standard deviation of points by team
ggplot(df_mean_std, aes(x=team, y=mean)) +
geom_errorbar(aes(ymin=mean-sd, ymax=mean+sd), width= .3 ) +
geom_point(size= 2 )
De resulterende grafiek toont het gemiddelde en de standaardafwijking van de punten die door spelers van elk team zijn gescoord.
De cirkels vertegenwoordigen de gemiddelde waarden en de lengte van de balken boven en onder elke cirkel vertegenwoordigt de standaardafwijking.
Opmerking : het breedteargument in de functie geom_errorbar() specificeert de breedte van foutbalken. U kunt deze waarde gerust wijzigen om de breedte van de foutbalken in de plot aan te passen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in ggplot2 kunt uitvoeren:
Hoe u een legenda aan ggplot2-plots toevoegt
Hoe de lettergrootte in ggplot2 te veranderen
Hoe een legenda in ggplot2 te verwijderen
Hoe aslabels te roteren in ggplot2