Как построить среднее и стандартное отклонение в ggplot2


Часто вам может потребоваться построить график среднего и стандартного отклонения по группам в ggplot2.

К счастью, это легко сделать с помощью функций geom_point() и geom_errorbar() в ggplot2.

В следующем примере показано, как использовать эти функции для создания следующего графика, показывающего среднее и стандартное отклонение очков, набранных разными баскетбольными командами:

среднее значение графика и стандартное отклонение в ggplot2

Пример: построение среднего значения и стандартного отклонения в ggplot2

Предположим, у нас есть следующий кадр данных в R, который содержит информацию о количестве очков, набранных баскетболистами из трех разных команд:

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 6 ),
                 points=c(8, 10, 12, 12, 14, 15, 10, 11, 12,
                          18, 22, 24, 3, 5, 5, 6, 7, 9))

#view head of data frame
head(df)

  team points
1 to 8
2 to 10
3 to 12
4 to 12
5 to 14
6 to 15

Мы можем использовать функции пакета dplyr для быстрого расчета среднего и стандартного отклонения очков, набранных игроками каждой команды:

 library (dplyr)

#calculate mean and sd of points by team
df_mean_std <- df %>%
  group_by(team) %>%
  summarise_at(vars(points), list(mean=mean, sd=sd)) %>% 
  as. data . frame ()

#view results
df_mean_std

  team mean sd
1 A 11.833333 2.562551
2 B 16.166667 6.013873
3 C 5.833333 2.041241

Наконец, мы можем использовать следующие функции ggplot2 для визуализации среднего и стандартного отклонения очков, набранных игроками каждой команды:

 library (ggplot2)

#plot mean and standard deviation of points by team
ggplot(df_mean_std, aes(x=team, y=mean)) + 
  geom_errorbar(aes(ymin=mean-sd, ymax=mean+sd), width= .3 ) +
  geom_point(size= 2 ) 

среднее значение графика и стандартное отклонение в ggplot2

Полученный график показывает среднее и стандартное отклонение очков, набранных игроками каждой команды.

Круги представляют собой средние значения, а длина полосок над и под каждым кружком представляет собой стандартное отклонение.

Примечание . Аргумент ширины в функции geom_errorbar() определяет ширину полос ошибок. Не стесняйтесь изменять это значение, чтобы отрегулировать ширину полос погрешностей на графике.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в ggplot2:

Как добавить легенду к графикам ggplot2
Как изменить размер шрифта в ggplot2
Как удалить легенду в ggplot2
Как повернуть метки осей в ggplot2

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *