Как создать сгруппированную диаграмму в r, используя ggplot2
Ящичные диаграммы полезны для визуализации пятизначного сводного набора данных, который включает в себя:
- Минимум
- Первый квартиль
- Медиана
- Третий квартиль
- Максимум
Связанный: Нежное введение в коробочные диаграммы
К счастью, в R легко создавать коробчатые диаграммы с помощью библиотеки визуализации ggplot2 .
Это также включает в себя создание коробчатых диаграмм , сгруппированных по определенной переменной в наборе данных. Например, предположим, что у нас есть следующий набор данных, который отображает повышение эффективности 150 баскетболистов из трех разных команд на основе двух разных программ тренировок:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Мы можем использовать следующий код для создания коробчатых диаграмм, отображающих повышение эффективности игроков, сгруппированных по командам и заполняемых на основе графика тренировок:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
Мы можем использовать аналогичный синтаксис для создания коробчатых диаграмм, отображающих повышение эффективности игроков, сгруппированных по программам тренировок и заполняемых по командам:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
Аналогичная альтернатива — использование фасетирования , при котором каждая подгруппа отображается на отдельной панели:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
В зависимости от данных, с которыми вы работаете, создание фасетов может соответствовать или не соответствовать вашим потребностям в визуализации.
Дополнительные ресурсы
Как удалить выбросы в коробчатых диаграммах в R
Как создавать параллельные графики в ggplot2
Полное руководство по лучшим темам ggplot2