Spss'de aykırı değerler nasıl belirlenir


Aykırı değer , bir veri kümesindeki diğer değerlerden anormal derecede uzak olan bir gözlemdir. Aykırı değerler sorunlu olabilir çünkü analizin sonuçlarını etkileyebilirler.

Bu eğitimde SPSS’de aykırı değerlerin nasıl tanımlanacağı ve ele alınacağı açıklanmaktadır.

SPSS’de aykırı değerler nasıl belirlenir

15 kişinin yıllık gelirini (bin olarak) gösteren aşağıdaki veri setine sahip olduğumuzu varsayalım:

Aykırı değerlerin mevcut olup olmadığını belirlemenin bir yolu, veri seti için bir kutu grafiği oluşturmaktır. Bunu yapmak için Analiz sekmesine, ardından Tanımlayıcı İstatistikler’e ve ardından Keşfet’e tıklayın:

Açılan yeni pencerede, gelir değişkenini bakmakla yükümlü olunan kişilerin listesi etiketli kutuya sürükleyin. Daha sonra İstatistikler’e tıklayın ve Yüzdelikler’in yanındaki kutunun işaretli olduğundan emin olun. Daha sonra Devam’ı tıklayın. Daha sonra Tamam’ı tıklayın.

Tamam’ı tıkladığınızda bir kutu grafiği görünecektir:

SPSS'de kutu grafiği

Kutu grafiğinin her iki ucunda da daire veya yıldız işareti yoksa, bu hiçbir aykırı değerin mevcut olmadığını gösterir.

SPSS, aşağıdaki aralıkların dışında kalan herhangi bir veri değerini aykırı değer olarak kabul eder:

  • 3. çeyrek + 1,5*çeyrekler arası aralık
  • 1. çeyrek – 1,5*çeyrekler arası aralık

Sonuçta Tukey Menteşeler etiketli satırdaki 75. ve 25. yüzdelikler arasındaki farkı alarak çeyrekler arası aralığı hesaplayabiliriz:

SPSS'de Tukey Menteşelerinin çeyrekler arası aralığı

Bu veri seti için çeyrekler arası aralık 82 – 36 = 46’dır . Bu nedenle, aşağıdaki aralıkların dışındaki tüm değerler aykırı değer olarak değerlendirilecektir:

  • 82 + 1,5*46 = 151
  • 36 – 1,5*46 = -33

Açıkçası gelir negatif olamaz, dolayısıyla bu örnekte alt sınır kullanışlı değildir. Ancak 151’in üzerindeki herhangi bir gelir aykırı değer olarak değerlendirilecektir.

Örneğin veri setimizdeki en büyük değerin 152 olduğunu varsayalım. İşte o veri setinin kutu grafiği:

SPSS'de aykırı değer içeren kutu grafiği

Daire, verilerde bir aykırı değerin mevcut olduğunu gösterir. 15 sayısı veri kümesindeki hangi gözlemin aykırı değer olduğunu gösterir.

SPSS ayrıca aşağıdaki aralıkların dışında kalan herhangi bir veri değerini aşırı aykırı değer olarak kabul eder:

  • 3. çeyrek + 3*çeyrekler arası aralık
  • 1. çeyrek – 3*çeyrekler arası aralık

Dolayısıyla, aşağıdaki aralıkların dışındaki tüm değerler, bu örnekte aşırı aykırı değerler olarak değerlendirilecektir:

  • 82 + 3*46 = 220
  • 36 – 3*46 = -102

Örneğin veri kümemizdeki en büyük değerin 221 olduğunu varsayalım. Bu veri kümesinin kutu grafiği şöyle:

SPSS'deki bir kutu grafiğinde aşırı aykırı değer

Yıldız işareti (*), verilerde aşırı bir aykırı değerin mevcut olduğunu gösterir. 15 sayısı, veri kümesindeki hangi gözlemin aşırı uç değer olduğunu gösterir.

Aykırı değerler nasıl ele alınır?

Verilerinizde aykırı değer varsa birkaç seçeneğiniz vardır:

1. Aykırı değerin veri girişi hatasından kaynaklanmadığından emin olun.

Bazen bir kişi verileri kaydederken yanlış veri değerini girer. Aykırı değer mevcutsa öncelikle değerin doğru girildiğini ve bunun bir hata olmadığını doğrulayın.

2. Aykırı değeri kaldırın.

Değer gerçekten aykırı bir değerse ve genel analiziniz üzerinde önemli bir etkisi olacaksa onu kaldırmayı seçebilirsiniz. Son raporunuzda veya analizinizde aykırı bir değeri kaldırdığınızı mutlaka belirtin.

3. Aykırı değere yeni bir değer atayın .

Aykırı değerin bir veri girişi hatasının sonucu olduğu ortaya çıkarsa, ona veri kümesinin ortalaması veya medyanı gibi yeni bir değer atamaya karar verebilirsiniz.

Ek kaynaklar

Aynı anda birden fazla değişkenle çalışıyorsanız aykırı değerleri tespit etmek için Mahalanobis mesafesini kullanmak isteyebilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir