Cara memplot beberapa plot kotak dalam satu grafik di r
Plot kotak (terkadang disebut plot kotak dan kumis) adalah plot yang menampilkan ringkasan lima angka dari sekumpulan data.
Ringkasan lima angka meliputi:
- Nilai minimum
- Kuartil pertama
- Nilai median
- Kuartil ketiga
- Nilai maksimum
Tutorial ini menjelaskan cara memplot beberapa plot kotak dalam satu plot di R, menggunakan Basis R dan ggplot2.
Plot kotak berbasis R
Untuk mengilustrasikan cara membuat plot kotak di R, kita akan menggunakan kumpulan data kualitas udara yang ada di R:
#view first 6 rows of "air quality" dataset
head(airquality)
#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6
Untuk membuat plot kotak tunggal untuk variabel “Ozon”, kita dapat menggunakan sintaks berikut:
#create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)
Ini menghasilkan plot kotak berikut:
Misalkan kita ingin membuat plot kotak untuk setiap bulan dalam kumpulan data. Sintaks berikut menunjukkan cara melakukan ini:
#create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)
Ini menghasilkan bagan berikut yang menampilkan diagram kotak untuk setiap bulan:
Plot kotak di ggplot2
Cara lain untuk membuat plot kotak di R adalah dengan menggunakan paket ggplot2 . Kami akan menggunakan kembali kumpulan data kualitas udara bawaan untuk contoh berikut.
Untuk membuat plot kotak tunggal untuk variabel “Ozon” dalam kumpulan data kualitas udara, kita dapat menggunakan sintaks berikut:
#create boxplot for the variable “Ozone”
library(ggplot2)
ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()
Ini menghasilkan plot kotak berikut:
Sebaliknya, jika kita ingin membuat plot kotak untuk setiap bulan dalam kumpulan data, kita dapat menggunakan sintaks berikut untuk melakukannya:
#create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)
ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
geom_boxplot(fill="steelblue") +
labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")
Ini menghasilkan bagan berikut yang menampilkan diagram kotak untuk setiap bulan:
Sumber daya tambahan
Tutorial berikut menawarkan informasi tambahan tentang plot kotak:
Kapan sebaiknya Anda menggunakan plot kotak? (3 skenario)
Cara Mengidentifikasi Asimetri pada Plot Kotak
Bagaimana Membandingkan Plot Kotak