Jak wykreślić wiele wykresów skrzynkowych na jednym wykresie w r


Wykres pudełkowy (czasami nazywany wykresem pudełkowo-wąskowym) to wykres przedstawiający pięciocyfrowe podsumowanie zbioru danych.

Podsumowanie składające się z pięciu liczb obejmuje:

  • Wartość minimalna
  • Pierwszy kwartyl
  • Wartość średnia
  • Trzeci kwartyl
  • Maksymalna wartość

W tym samouczku wyjaśniono, jak wykreślić wiele wykresów skrzynkowych na jednym wykresie w języku R, używając Base R i ggplot2.

Wykresy pudełkowe oparte na R

Aby zilustrować sposób tworzenia wykresów skrzynkowych w języku R, będziemy pracować ze zbiorem danych o jakości powietrza wbudowanym w R:

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

Aby utworzyć pojedynczy wykres pudełkowy dla zmiennej „Ozon”, możemy zastosować następującą składnię:

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

Generuje to następujący wykres pudełkowy:

Załóżmy, że zamiast tego chcemy wygenerować wykres pudełkowy dla każdego miesiąca w zestawie danych. Poniższa składnia pokazuje, jak to zrobić:

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

Spowoduje to wygenerowanie następującego wykresu przedstawiającego wykres pudełkowy dla każdego miesiąca:

Wykresy pudełkowe w ggplot2

Innym sposobem tworzenia wykresów skrzynkowych w R jest użycie pakietu ggplot2 . W poniższych przykładach ponownie użyjemy wbudowanego zbioru danych o jakości powietrza .

Aby utworzyć pojedynczy wykres pudełkowy dla zmiennej „Ozon” w zbiorze danych dotyczących jakości powietrza, możemy zastosować następującą składnię:

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Generuje to następujący wykres pudełkowy:

Jeśli zamiast tego chcemy wygenerować wykres pudełkowy dla każdego miesiąca w zestawie danych, możemy w tym celu użyć następującej składni:

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

Spowoduje to wygenerowanie następującego wykresu przedstawiającego wykres pudełkowy dla każdego miesiąca:

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat wykresów skrzynkowych:

Kiedy warto zastosować wykres pudełkowy? (3 scenariusze)
Jak rozpoznać asymetrię na wykresach pudełkowych
Jak porównać wykresy pudełkowe

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *