Boxplots tekenen met gemiddelde waarden in r (met voorbeelden)


U kunt de volgende methoden gebruiken om een boxplot te tekenen met een gemiddelde waarde in R:

Methode 1: Gebruik Base R

 #create boxplots
boxplot(df$values~df$group)

#calculate mean value by group
means <- tapply(df$values, df$group, mean)

#add means as circles to each boxplot
points(means, pch= 20 )

Methode 2: gebruik ggplot2

 library (ggplot2)

#create boxplots with mean values shown as circles
ggplot(df, aes(x=group, y=values, fill=group)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom=' point ', shape= 20 )

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=rep(c('A', 'B', 'C'), each= 5 ),
                 points=c(4, 4, 5, 6, 8, 7, 6, 8, 9, 12,
                          11, 12, 13, 16, 18))

#view first six rows of data frame
head(df)

  team points
1 to 4
2 to 4
3 to 5
4 to 6
5 to 8
6 B 7

Voorbeeld 1: Maak boxplots met gemiddelde waarden in basis R

De volgende code laat zien hoe u boxplots maakt met gemiddelde waarden in basis R:

 #create boxplots
boxplot(df$points~df$team)

#calculate mean value by group
means <- tapply(df$points, df$team, mean)

#add means as circles to each boxplot
points(means, pch= 20 , cex= 1.5 ) 

De zwarte lijnen binnen elke boxplot vertegenwoordigen de mediaanwaarde en de zwarte cirkels binnen elke boxplot vertegenwoordigen de gemiddelde waarde.

Opmerking : verander de waarde van het cex- argument om de grootte van de cirkel te wijzigen.

Voorbeeld 2: Maak boxplots met gemiddelde waarden in ggplot2

De volgende code laat zien hoe u boxplots met gemiddelde waarden in ggplot2 maakt:

 library (ggplot2)

#create boxplots with mean values
ggplot(df, aes(x=team, y=points, fill=team)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom=' point ', shape= 20 , size= 8 ) +
  theme(legend. position = ' none ') 

boxplot met gemiddelde waarde in R

De zwarte lijnen binnen elke boxplot vertegenwoordigen de mediaanwaarde en de zwarte cirkels binnen elke boxplot vertegenwoordigen de gemiddelde waarde.

Opmerking : verander de waarde van het argument size in de functie stat_summary() om de grootte van de cirkel te wijzigen.

Aanvullende bronnen

De volgende tutorials bieden aanvullende informatie over boxplots:

Wanneer moet je een boxplot gebruiken? (3 scenario’s)
Hoe asymmetrie in boxplots te identificeren
Boxplots vergelijken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert