R'deki kutu grafiklerindeki aykırı değerler nasıl kaldırılır


Bazen R’deki kutu grafiklerinden aykırı değerleri kaldırmak isteyebilirsiniz.

Bu eğitimde bunun hem temel R hem de ggplot2 kullanılarak nasıl yapılacağı açıklanmaktadır.

Base R’deki kutu grafiklerindeki aykırı değerleri kaldırın

Aşağıdaki veri setine sahip olduğumuzu varsayalım:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

Aşağıdaki kod, R tabanında bu veri kümesi için bir kutu grafiğinin nasıl oluşturulacağını gösterir:

 boxplot(data)

Aykırı değerleri kaldırmak için anahat=YANLIŞ bağımsız değişkenini kullanabilirsiniz:

 boxplot(data, outline= FALSE ) 

R'de aykırı değerin kaldırıldığı kutu grafiği

Ggplot2’deki kutu grafiklerindeki aykırı değerleri kaldırın

Aşağıdaki veri setine sahip olduğumuzu varsayalım:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

Aşağıdaki kod, ggplot2 görselleştirme kitaplığını kullanarak kutu grafiğinin nasıl oluşturulacağını gösterir:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

Aykırı değerleri kaldırmak için outlier.shape=NA bağımsız değişkenini kullanabilirsiniz:

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

Aykırı değerlerin kaldırıldığı ggplot2 kutu grafiği

ggplot2’nin y eksenini otomatik olarak ayarlamadığını unutmayın.

Y eksenini ayarlamak için coord_cartesian komutunu kullanabilirsiniz:

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

aykırı değerler olmadan boxplot ggplot2

Ylim() argümanını kullanarak belirttiğimiz gibi, y ekseni artık 5 ile 30 arasında değişmektedir.

Ek kaynaklar

Aşağıdaki eğitimlerde ggplot2’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Ggplot2’de eksen sınırları nasıl ayarlanır?
Ggplot2’de yan yana grafikler nasıl oluşturulur
Ggplot2’deki kutu grafiklerindeki aykırı değerler nasıl etiketlenir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir