Як побудувати середнє за допомогою geom_bar() у ggplot2


Ви можете використовувати наступний базовий синтаксис, щоб побудувати середні значення за групою за допомогою функції geom_bar() у ggplot2:

 library (ggplot2)

ggplot(df, aes(group_var, values_var)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Примітка : цікавий аргумент у geom_bar() повідомляє ggplot2, яку описову статистику відображати за допомогою стовпчиків. Ви також можете передати цьому аргументу іншу описову статистику, наприклад «медіану», щоб побудувати середнє значення за групами.

Приклад: побудова графіка середніх значень за допомогою geom_bar() у ggplot2

Припустимо, що ми маємо такий кадр даних, що містить інформацію про кількість очок, набраних баскетболістами різних команд:

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ),
                 points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8))

#view data frame
df

   team points
1 to 3
2 to 5
3 to 5
4 to 6
5 B 5
6 B 7
7 B 7
8 B 8
9 C 9
10 C 9
11 C 9
12 C 8

Ми можемо використати такий синтаксис, щоб створити гістограму, у якій кожна смуга представляє середнє значення балів , згруповане за командою :

 library (ggplot2)

#create bar plot to visualize mean points value by team
ggplot(df, aes(team, points)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ') 

побудуйте середнє значення за допомогою geom_bar у ggplot2

Висота кожного стовпчика відображає середнє значення балів кожної команди .

Щоб відобразити фактичне середнє значення балів кожної команди, ми можемо використати функцію summarise() з пакету dplyr :

 library (dplyr)

#calculate mean value of points, grouped by team
df %>%
  group_by(team) %>%
  summarise(mean_pts = mean(points, na. rm = TRUE ))

# A tibble: 3 x 2
  team mean_pts
      
1 to 4.75
2 B 6.75
3 C 8.75

З результату ми можемо побачити середнє значення балів для кожної команди:

  • Команда А: 4,75
  • Команда Б: 6,75
  • Команда С: 8,75

Ці значення відповідають висоті стовпчиків, відображених на гістограмі вище.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в ggplot2:

Як налаштувати відстань між смугами в ggplot2
Як видалити NA з графіка в ggplot2
Як змінити кольори стовпців у гістограмі зі накопиченням у ggplot2

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *