Як побудувати кілька коробкових графіків на одному графіку в r
Коробчатий графік (іноді його називають прямокутним і вусовим графіком) — це графік, який показує п’ятизначний підсумок набору даних.
Зведення з п’яти цифр включає:
- Мінімальне значення
- Перший квартиль
- Середнє значення
- Третій квартиль
- Максимальне значення
У цьому підручнику пояснюється, як побудувати кілька коробкових графіків на одному графіку в R за допомогою Base R і ggplot2.
Boxplots на основі R
Щоб проілюструвати, як створити коробкові діаграми в R, ми будемо працювати з набором даних про якість повітря, вбудованим у R:
#view first 6 rows of "air quality" dataset
head(airquality)
#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6
Щоб створити єдину коробкову діаграму для змінної «Озон», ми можемо використати такий синтаксис:
#create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)
Це генерує такий коробковий графік:
Припустімо, замість цього ми хочемо створити коробковий графік для кожного місяця в наборі даних. Наступний синтаксис показує, як це зробити:
#create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)
Це генерує таку діаграму, яка відображає коробковий графік для кожного місяця:
Коробкові діаграми в ggplot2
Ще один спосіб створити коробкові діаграми в R — використовувати пакет ggplot2 . Ми знову використаємо вбудований набір даних про якість повітря для наступних прикладів.
Щоб створити єдину коробкову діаграму для змінної «Озон» у наборі даних якості повітря, ми можемо використати такий синтаксис:
#create boxplot for the variable “Ozone”
library(ggplot2)
ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()
Це генерує такий коробковий графік:
Якщо замість цього ми хочемо згенерувати коробковий графік для кожного місяця в наборі даних, ми можемо використати для цього такий синтаксис:
#create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)
ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
geom_boxplot(fill="steelblue") +
labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")
Це генерує таку діаграму, яка відображає коробковий графік для кожного місяця:
Додаткові ресурси
Наступні навчальні посібники пропонують додаткову інформацію про коробкові діаграми:
Коли слід використовувати коробковий графік? (3 сценарії)
Як визначити асиметрію на прямокутних графіках
Як порівняти коробкові діаграми