Aykırı değerlerle kutu grafiği nasıl okunur (örnekle)


Kutu grafiği, aşağıdakileri içeren bir veri kümesinin beş basamaklı özetini görüntüleyen bir grafik türüdür:

  • Asgari değer
  • İlk çeyrek (25. yüzdelik dilim)
  • Medyan değer
  • Üçüncü çeyrek (75. yüzdelik dilim)
  • Maksimum değer

Bir kutu grafiği oluşturmak için önce birinci çeyrekten üçüncü çeyreğe kadar bir kutu çizeriz.

Daha sonra ortancaya dikey bir çizgi çiziyoruz.

Son olarak çeyreklerin “bıyıklarını” minimum ve maksimum değere kadar çiziyoruz.

Çoğu istatistik yazılımında, bir gözlem aşağıdaki iki gereksinimden birini karşılıyorsa aykırı değer olarak tanımlanır:

  • Gözlem, ilk çeyreğin (Q1) altındaki çeyrekler arası aralığın 1,5 katıdır.
  • Gözlem, üçüncü çeyreğin (Q3) üzerindeki çeyrekler arası aralığın 1,5 katıdır.

Bir veri setinde bir aykırı değer mevcutsa, genellikle kutu grafiğindeki çizgi aralığının dışında küçük bir nokta ile etiketlenir:

kutu grafiklerinde aykırı değerlerin nasıl okunacağı

Bu gerçekleştiğinde, kutu grafiğindeki “minimum” ve “maksimum” değerlere sırasıyla Q1 – 1,5*IQR ve Q3 + 1,5*IQR değerleri atanır.

Aşağıdaki örnek, kutu grafiklerinin aykırı değerlerle ve aykırı değerler olmadan nasıl yorumlanacağını gösterir.

Örnek: Aykırı Değerlerle Kutu Grafiğinin Yorumlanması

İki farklı takımdan basketbolcuların attığı puanların dağılımını görselleştirmek için aşağıdaki iki kutu grafiğini oluşturduğumuzu varsayalım:

A Takımının sol kutu grafiğinde minimum veya maksimum bıyık dışında küçük noktalar bulunmadığından aykırı değerler yoktur.

Bununla birlikte, B Takımı için sağdaki kutu grafiği “maksimum” değerin üzerinde bir aykırı değere ve “minimum” değerin altında bir aykırı değere sahiptir.

B Takımı için “Puan” değişkeninin dağılımına ilişkin mevcut beş haneli özet:

  • Minimum değer: 1,1
  • İlk çeyrek: 10,5
  • Medyan: 12,7
  • Üçüncü çeyrek: 15,6
  • Maksimum değer: 23,5

Potansiyel aykırı değerlerin sınırlarını şu şekilde hesaplayabilirsiniz:

Çeyrekler arası ölçek : Üçüncü çeyrek – Birinci çeyrek = 15,6 – 10,5 = 5,1

Alt sınır : Q1 – 1,5*IQR = 10,5 – 1,5*5,1 = 2,85

Üst sınır : Q3 + 1,5*IQR = 15,6 + 1,5*5,1 = 23,25

Kutu grafiğindeki minimum ve maksimum değerlere ilişkin bıyıklar 2,85 ve 23,25’e yerleştirilmiştir.

Dolayısıyla, 1,1 ve 23,5 değerlerine sahip gözlemlerin her ikisi de, alt ve üst sınırların dışında kaldıkları için kutu grafiğinde aykırı değer olarak nitelendirilir.

Bonus : İşte bu iki kutu grafiğini R programlama dilinde oluşturmak için kullandığımız kodun tamamı:

 library (ggplot2)

#make this example reproducible 
set. seeds (2)

#create data frame
df <- data. frame (Team = factor(rep(c("A", "B"), each = 200)), 
                 Points = c(rnorm(200, mean = 15, sd = 3), 
                           rnorm(200, mean = 12, sd = 4))) 

#create box plots
ggplot(df, aes(x = Team, y = Points)) +
  stat_boxplot(geom = " errorbar ", width = 0.5) +  
  geom_boxplot() 

#calculate summary statistics for each team
tapply(df$Points, df$Team, summary)

Ek kaynaklar

Aşağıdaki eğitimler kutu grafikleri hakkında ek bilgi sağlar:

Kutu Grafikleri Nasıl Karşılaştırılır
Kutu Grafiklerinde Asimetri Nasıl Belirlenir?
Bir kutu grafiğinin çeyrekler arası aralığı nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir