Cara menghapus outlier di plot kotak di r


Terkadang Anda mungkin ingin menghapus outlier dari plot kotak di R.

Tutorial ini menjelaskan cara melakukan ini menggunakan basis R dan ggplot2 .

Hapus outlier di plot kotak di Basis R

Misalkan kita memiliki kumpulan data berikut:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

Kode berikut menunjukkan cara membuat plot kotak untuk kumpulan data ini di basis R:

 boxplot(data)

Untuk menghilangkan outlier, Anda dapat menggunakan argumen outline=FALSE :

 boxplot(data, outline= FALSE ) 

Boxplot dengan outlier dihapus di R

Hapus outlier di plot kotak di ggplot2

Misalkan kita memiliki kumpulan data berikut:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

Kode berikut menunjukkan cara membuat plot kotak menggunakan pustaka visualisasi ggplot2:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

Untuk menghapus outlier, Anda dapat menggunakan argumen outlier.shape=NA :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

ggplot2 boxplot dengan outlier dihilangkan

Perhatikan bahwa ggplot2 tidak secara otomatis menyesuaikan sumbu y.

Untuk mengatur sumbu y Anda dapat menggunakan coord_cartesian :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

boxplot ggplot2 tanpa outlier

Sumbu y sekarang berkisar antara 5 hingga 30, seperti yang kita tentukan menggunakan argumen ylim() .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di ggplot2:

Cara menetapkan batas sumbu di ggplot2
Cara membuat plot berdampingan di ggplot2
Cara memberi label outlier pada plot kotak di ggplot2

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *