Как рисовать коробчатые диаграммы со средними значениями в r (с примерами)


Вы можете использовать следующие методы, чтобы нарисовать коробчатую диаграмму со средним значением в R:

Метод 1: используйте базу R

 #create boxplots
boxplot(df$values~df$group)

#calculate mean value by group
means <- tapply(df$values, df$group, mean)

#add means as circles to each boxplot
points(means, pch= 20 )

Способ 2: используйте ggplot2

 library (ggplot2)

#create boxplots with mean values shown as circles
ggplot(df, aes(x=group, y=values, fill=group)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom=' point ', shape= 20 )

В следующих примерах показано, как использовать каждый метод на практике со следующим фреймом данных в R:

 #create data frame
df <- data. frame (team=rep(c('A', 'B', 'C'), each= 5 ),
                 points=c(4, 4, 5, 6, 8, 7, 6, 8, 9, 12,
                          11, 12, 13, 16, 18))

#view first six rows of data frame
head(df)

  team points
1 to 4
2 to 4
3 to 5
4 to 6
5 to 8
6 B 7

Пример 1. Создайте коробчатые диаграммы со средними значениями в базе R.

Следующий код показывает, как создавать коробчатые диаграммы со средними значениями в базе R:

 #create boxplots
boxplot(df$points~df$team)

#calculate mean value by group
means <- tapply(df$points, df$team, mean)

#add means as circles to each boxplot
points(means, pch= 20 , cex= 1.5 ) 

Черные линии внутри каждой диаграммы представляют медианное значение, а черные кружки внутри каждой диаграммы представляют среднее значение.

Примечание . Измените значение аргумента cex , чтобы изменить размер круга.

Пример 2: Создание коробчатых диаграмм со средними значениями в ggplot2

Следующий код показывает, как создавать коробчатые диаграммы со средними значениями в ggplot2:

 library (ggplot2)

#create boxplots with mean values
ggplot(df, aes(x=team, y=points, fill=team)) +
  geom_boxplot() +
  stat_summary(fun=mean, geom=' point ', shape= 20 , size= 8 ) +
  theme(legend. position = ' none ') 

коробчатая диаграмма со средним значением в R

Черные линии внутри каждой диаграммы представляют медианное значение, а черные кружки внутри каждой диаграммы представляют среднее значение.

Примечание . Измените значение аргумента размера в функции stat_summary() , чтобы изменить размер круга.

Дополнительные ресурсы

Следующие руководства содержат дополнительную информацию о коробчатых диаграммах:

Когда следует использовать коробчатую диаграмму? (3 сценария)
Как определить асимметрию в коробчатых диаграммах
Как сравнивать коробчатые диаграммы

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *