Як побудувати кілька коробкових графіків на одному графіку в r


Коробчатий графік (іноді його називають прямокутним і вусовим графіком) — це графік, який показує п’ятизначний підсумок набору даних.

Зведення з п’яти цифр включає:

  • Мінімальне значення
  • Перший квартиль
  • Середнє значення
  • Третій квартиль
  • Максимальне значення

У цьому підручнику пояснюється, як побудувати кілька коробкових графіків на одному графіку в R за допомогою Base R і ggplot2.

Boxplots на основі R

Щоб проілюструвати, як створити коробкові діаграми в R, ми будемо працювати з набором даних про якість повітря, вбудованим у R:

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

Щоб створити єдину коробкову діаграму для змінної «Озон», ми можемо використати такий синтаксис:

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

Це генерує такий коробковий графік:

Припустімо, замість цього ми хочемо створити коробковий графік для кожного місяця в наборі даних. Наступний синтаксис показує, як це зробити:

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

Це генерує таку діаграму, яка відображає коробковий графік для кожного місяця:

Коробкові діаграми в ggplot2

Ще один спосіб створити коробкові діаграми в R — використовувати пакет ggplot2 . Ми знову використаємо вбудований набір даних про якість повітря для наступних прикладів.

Щоб створити єдину коробкову діаграму для змінної «Озон» у наборі даних якості повітря, ми можемо використати такий синтаксис:

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Це генерує такий коробковий графік:

Якщо замість цього ми хочемо згенерувати коробковий графік для кожного місяця в наборі даних, ми можемо використати для цього такий синтаксис:

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

Це генерує таку діаграму, яка відображає коробковий графік для кожного місяця:

Додаткові ресурси

Наступні навчальні посібники пропонують додаткову інформацію про коробкові діаграми:

Коли слід використовувати коробковий графік? (3 сценарії)
Як визначити асиметрію на прямокутних графіках
Як порівняти коробкові діаграми

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *