Spss'de mahalanobis mesafesi nasıl hesaplanır?


Mahalanobis mesafesi çok değişkenli bir uzayda iki nokta arasındaki mesafedir. Birden fazla değişkeni içeren istatistiksel analizlerde aykırı değerleri tespit etmek için sıklıkla kullanılır.

Bu eğitimde SPSS’de Mahalanobis mesafesinin nasıl hesaplanacağı açıklanmaktadır.

Örnek: SPSS’de Mahalanobis Mesafesi

20 öğrencinin sınav puanlarının yanı sıra ders çalışarak geçirdikleri saat sayısını, girdikleri uygulama sınavlarının sayısını ve dersteki güncel notlarını gösteren aşağıdaki veri setine sahip olduğumuzu varsayalım:

Çok değişkenli aykırı değerlerin olup olmadığını belirlemek amacıyla veri kümesindeki her gözlem için Mahalanobis mesafesini hesaplamak amacıyla aşağıdaki adımları kullanabiliriz.

Adım 1: Doğrusal Regresyon seçeneğini seçin.

Analiz sekmesine, ardından Regresyon’a ve ardından Doğrusal’a tıklayın:

Adım 2: Mahalanobis seçeneğini seçin.

Yanıt değişkeni puanını Bağımlı etiketli kutuya sürükleyin. Diğer üç öngörücü değişkeni Bağımsız(lar) etiketli kutuya sürükleyin. Daha sonra Kaydet butonuna tıklayın. Açılan yeni pencerede Mahalanobis’in yanındaki kutunun işaretli olduğundan emin olun. Daha sonra Devam’ı tıklayın. Daha sonra Tamam’ı tıklayın.

SPSS'de Mahalanobis Mesafesi

Tamam’a tıkladığınızda veri kümesindeki her gözlem için Mahalanobis mesafesi MAH_1 başlıklı yeni bir sütunda görünecektir:

Bazı mesafelerin diğerlerinden çok daha büyük olduğunu görebiliriz. Mesafelerden herhangi birinin istatistiksel olarak anlamlı olup olmadığını belirlemek için p değerlerini hesaplamamız gerekir.

Adım 3: Her Mahalanobis mesafesinin p değerlerini hesaplayın.

Dönüşüm sekmesini ve ardından Değişkeni Hesapla’yı tıklayın.

Hedef Değişken kutusunda, oluşturduğunuz değişken için yeni bir ad seçin. Biz “pvalue” diyoruz. Sayısal İfade kutusuna aşağıdakini girin:

1 – CDF.CHISQ(MAH_1, 3)

Daha sonra Tamam’ı tıklayın.

Bu, 3 serbestlik derecesine sahip Ki-kare değerine karşılık gelen bir p değeri üretecektir. Regresyon modelimizde 3 adet yordayıcı değişken olduğundan 3 serbestlik derecesi kullanıyoruz.

Adım 4: p değerlerini yorumlayın.

Tamam’a tıkladığınızda, her Mahalanobis mesafesinin p değeri yeni bir sütunda görüntülenecektir:

SPSS'de Mahalanobis mesafesi için P değerleri

Varsayılan olarak SPSS yalnızca iki ondalık basamaklı p değerlerini görüntüler. SPSS’in alt kısmındaki Değişkenleri Görüntüle’ye tıklayarak ve Ondalık Basamaklar sütunundaki sayıyı artırarak ondalık basamak sayısını artırabilirsiniz:

Veri görünümüne döndüğünüzde, her p değerinin beş ondalık basamakla görüntülendiğini görebilirsiniz. 0,001’den küçük herhangi bir p değeri aykırı değer olarak kabul edilir.

İlk gözlemin veri kümesindeki tek aykırı değer olduğunu görebiliriz çünkü p değeri 0,001’den küçüktür:

Aykırı değerler nasıl ele alınır?

Verilerinizde aykırı değer varsa birkaç seçeneğiniz vardır:

1. Aykırı değerin veri girişi hatasından kaynaklanmadığından emin olun.

Bazen bir kişi verileri kaydederken yanlış veri değerini girer. Aykırı değer mevcutsa öncelikle veri değerinin doğru girildiğini ve bunun bir hata olmadığını doğrulayın.

2. Aykırı değeri kaldırın.

Değer gerçekten aykırı bir değerse ve genel analiziniz üzerinde önemli bir etkisi olacaksa onu kaldırmayı seçebilirsiniz. Son raporunuzda veya analizinizde aykırı bir değeri kaldırdığınızı mutlaka belirtin.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir