Як побудувати середнє за допомогою geom_bar() у ggplot2
Ви можете використовувати наступний базовий синтаксис, щоб побудувати середні значення за групою за допомогою функції geom_bar() у ggplot2:
library (ggplot2) ggplot(df, aes(group_var, values_var)) + geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Примітка : цікавий аргумент у geom_bar() повідомляє ggplot2, яку описову статистику відображати за допомогою стовпчиків. Ви також можете передати цьому аргументу іншу описову статистику, наприклад «медіану», щоб побудувати середнє значення за групами.
Приклад: побудова графіка середніх значень за допомогою geom_bar() у ggplot2
Припустимо, що ми маємо такий кадр даних, що містить інформацію про кількість очок, набраних баскетболістами різних команд:
#create data frame df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ), points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8)) #view data frame df team points 1 to 3 2 to 5 3 to 5 4 to 6 5 B 5 6 B 7 7 B 7 8 B 8 9 C 9 10 C 9 11 C 9 12 C 8
Ми можемо використати такий синтаксис, щоб створити гістограму, у якій кожна смуга представляє середнє значення балів , згруповане за командою :
library (ggplot2) #create bar plot to visualize mean points value by team ggplot(df, aes(team, points)) + geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')
Висота кожного стовпчика відображає середнє значення балів кожної команди .
Щоб відобразити фактичне середнє значення балів кожної команди, ми можемо використати функцію summarise() з пакету dplyr :
library (dplyr) #calculate mean value of points, grouped by team df %>% group_by(team) %>% summarise(mean_pts = mean(points, na. rm = TRUE )) # A tibble: 3 x 2 team mean_pts 1 to 4.75 2 B 6.75 3 C 8.75
З результату ми можемо побачити середнє значення балів для кожної команди:
- Команда А: 4,75
- Команда Б: 6,75
- Команда С: 8,75
Ці значення відповідають висоті стовпчиків, відображених на гістограмі вище.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в ggplot2:
Як налаштувати відстань між смугами в ggplot2
Як видалити NA з графіка в ggplot2
Як змінити кольори стовпців у гістограмі зі накопиченням у ggplot2