Як створити згруповану коробкову діаграму в r за допомогою ggplot2
Boxplots корисні для візуалізації п’ятизначного підсумку набору даних, який включає:
- мінімум
- Перший квартиль
- Медіана
- Третій квартиль
- Максимум
Пов’язане: Легкий вступ до Boxplots
На щастя, створювати коробкові діаграми в R легко за допомогою бібліотеки візуалізації ggplot2 .
Це також передбачає створення коробкових графіків , згрупованих за певною змінною в наборі даних. Наприклад, припустимо, що ми маємо такий набір даних, який відображає підвищення ефективності 150 баскетболістів із трьох різних команд на основі двох різних програм тренувань:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Ми можемо використати наступний код, щоб створити коробкові графіки, які відображатимуть підвищення ефективності гравців, згруповані за командами та заповнені на основі розкладу тренувань:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
Ми можемо використовувати подібний синтаксис для створення коробкових графіків, які відображають збільшення ефективності гравців, згруповані за програмою тренувань і заповнені командою:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
Подібною альтернативою є використання faceting , у якому кожна підгрупа відображається на окремій панелі:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
Залежно від даних, з якими ви працюєте, створення фасетів може задовольняти або не відповідати вашим потребам візуалізації.
Додаткові ресурси
Як видалити викиди в коробкових діаграмах у R
Як створити діаграми поруч у ggplot2
Повний посібник із найкращих тем ggplot2