Как построить несколько коробчатых диаграмм на одном графике в r


Ящичная диаграмма (иногда называемая диаграммой с усами) — это график, который показывает пятизначную сводку набора данных.

Пятизначное резюме включает в себя:

  • Минимальное значение
  • Первый квартиль
  • Медианное значение
  • Третий квартиль
  • Максимальное значение

В этом руководстве объясняется, как построить несколько коробчатых диаграмм на одном графике в R, используя Base R и ggplot2.

Ящичные диаграммы на основе R

Чтобы проиллюстрировать, как создавать коробчатые диаграммы в R, мы будем работать с набором данных о качестве воздуха, встроенным в R:

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

Чтобы создать единую диаграмму для переменной «Озон», мы можем использовать следующий синтаксис:

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

Это генерирует следующий коробчатый график:

Предположим, что вместо этого мы хотим создать коробчатую диаграмму для каждого месяца в наборе данных. Следующий синтаксис показывает, как это сделать:

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

В результате будет создана следующая диаграмма, отображающая коробчатую диаграмму для каждого месяца:

Ящичные диаграммы в ggplot2

Другой способ создания коробчатых диаграмм в R — использовать пакет ggplot2 . Мы снова будем использовать встроенный набор данных о качестве воздуха для следующих примеров.

Чтобы создать единую диаграмму для переменной «Озон» в наборе данных о качестве воздуха, мы можем использовать следующий синтаксис:

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Это генерирует следующий коробчатый график:

Если вместо этого мы хотим создать коробчатую диаграмму для каждого месяца в наборе данных, мы можем использовать для этого следующий синтаксис:

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

В результате будет создана следующая диаграмма, отображающая коробчатую диаграмму для каждого месяца:

Дополнительные ресурсы

Следующие руководства содержат дополнительную информацию о коробчатых диаграммах:

Когда следует использовать коробчатую диаграмму? (3 сценария)
Как определить асимметрию в коробчатых диаграммах
Как сравнивать коробчатые диаграммы

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *