Çeyrekler arası aralığı kullanarak aykırı değerler nasıl bulunur?
Aykırı değer , bir veri kümesindeki diğer değerlerden anormal derecede uzak olan bir gözlemdir . Aykırı değerler sorunlu olabilir çünkü analizin sonuçlarını etkileyebilirler.
Bir veri kümesindeki aykırı değerleri tespit etmenin yaygın bir yolu, çeyrekler arası aralığı kullanmaktır.
Genellikle IQR olarak kısaltılan çeyrekler arası aralık, bir veri setindeki 25. yüzdelik dilim (Q1) ile 75. yüzdelik dilim (Q3) arasındaki farktır. Değerlerin ortalama %50’sinin dağılımını ölçer.
Popüler bir yöntem, bir gözlemin IQR’den 1,5 kat daha yüksek veya IQR’den 1,5 kat daha düşük bir değere sahip olması durumunda aykırı değer olarak ilan edilmesidir.
Bu öğretici, bu yöntemi kullanarak bir veri kümesindeki aykırı değerlerin nasıl bulunacağına ilişkin adım adım bir örnek sağlar.
1. Adım: Verileri oluşturun
Aşağıdaki veri setine sahip olduğumuzu varsayalım:
Adım 2: Birinci ve üçüncü çeyreği belirleyin
İlk çeyrek 5 , üçüncü çeyrek ise 20,75 çıkıyor.
Böylece çeyrekler arası aralık 20,75 -5 = 15,75 olur.
3. Adım: Alt ve üst limitleri bulun
Alt limit şu şekilde hesaplanır:
Alt sınır = Q1 – 1,5*IQR = 5 – 1,5*15,75 = -18,625
Üst limit ise şu şekilde hesaplanır:
Üst sınır = Q3 + 1,5*IQR = 20,75 + 1,5*15,75 = 44,375
4. Adım: Aykırı değerleri belirleyin
Veri setinde alt sınırın altında veya üst sınırın üzerinde değeri olan tek gözlem 46’dır . Yani bu veri setindeki tek aykırı değer bu.
Not: Belirli bir veri kümesindeki aykırı değerlerin üst ve alt sınırlarını otomatik olarak bulmak için bu aykırı değer sınırları hesaplayıcısını kullanabilirsiniz.
Uygulamada aykırı değerler nasıl bulunur?
Aşağıdaki eğitimler, farklı istatistiksel yazılımlarda çeyrekler arası aralığı kullanarak aykırı değerlerin nasıl bulunacağını açıklamaktadır:
Excel’de aykırı değerler nasıl bulunur?
R’de aykırı değerler nasıl bulunur?
Python’da aykırı değerler nasıl bulunur?
SPSS’de aykırı değerler nasıl bulunur?