Cara memplot beberapa plot kotak dalam satu grafik di r


Plot kotak (terkadang disebut plot kotak dan kumis) adalah plot yang menampilkan ringkasan lima angka dari sekumpulan data.

Ringkasan lima angka meliputi:

  • Nilai minimum
  • Kuartil pertama
  • Nilai median
  • Kuartil ketiga
  • Nilai maksimum

Tutorial ini menjelaskan cara memplot beberapa plot kotak dalam satu plot di R, menggunakan Basis R dan ggplot2.

Plot kotak berbasis R

Untuk mengilustrasikan cara membuat plot kotak di R, kita akan menggunakan kumpulan data kualitas udara yang ada di R:

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

Untuk membuat plot kotak tunggal untuk variabel “Ozon”, kita dapat menggunakan sintaks berikut:

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

Ini menghasilkan plot kotak berikut:

Misalkan kita ingin membuat plot kotak untuk setiap bulan dalam kumpulan data. Sintaks berikut menunjukkan cara melakukan ini:

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

Ini menghasilkan bagan berikut yang menampilkan diagram kotak untuk setiap bulan:

Plot kotak di ggplot2

Cara lain untuk membuat plot kotak di R adalah dengan menggunakan paket ggplot2 . Kami akan menggunakan kembali kumpulan data kualitas udara bawaan untuk contoh berikut.

Untuk membuat plot kotak tunggal untuk variabel “Ozon” dalam kumpulan data kualitas udara, kita dapat menggunakan sintaks berikut:

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Ini menghasilkan plot kotak berikut:

Sebaliknya, jika kita ingin membuat plot kotak untuk setiap bulan dalam kumpulan data, kita dapat menggunakan sintaks berikut untuk melakukannya:

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

Ini menghasilkan bagan berikut yang menampilkan diagram kotak untuk setiap bulan:

Sumber daya tambahan

Tutorial berikut menawarkan informasi tambahan tentang plot kotak:

Kapan sebaiknya Anda menggunakan plot kotak? (3 skenario)
Cara Mengidentifikasi Asimetri pada Plot Kotak
Bagaimana Membandingkan Plot Kotak

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *