Değiştirilmiş z puanı nedir? (tanım & #038; örnek)
İstatistiklerde z-puanı bize bir değerin ortalamadan kaç standart sapma olduğunu söyler. Z-puanını hesaplamak için aşağıdaki formülü kullanırız:
Z puanı = (x i – μ) / σ
Altın:
- x i : tek bir veri değeri
- μ: veri setinin ortalaması
- σ: veri kümesinin standart sapması
Z puanları genellikle bir veri kümesindeki aykırı değerleri tespit etmek için kullanılır. Örneğin, z-puanı -3’ten küçük veya 3’ten büyük olan gözlemler genellikle aykırı değerler olarak kabul edilir.
Ancak z-puanları alışılmadık derecede büyük veya küçük veri değerlerinden etkilenebilir. Bu nedenle aykırı değerleri tespit etmenin daha sağlam bir yolu, aşağıdaki şekilde hesaplanan değiştirilmiş bir z-puanı kullanmaktır:
Değiştirilmiş z-puanı = 0,6745 (x i – x̃) / MAD
Altın:
- x i : tek bir veri değeri
- x̃ : Veri kümesinin medyanı
- MAD: veri kümesinin medyan mutlak sapması
Değiştirilmiş bir z-puanı daha sağlamdır çünkü z-puanlarını hesaplamak için aykırı değerlerden etkilendiği bilinen ortalamanın aksine medyanı kullanır.
Iglewicz ve Hoaglin, değiştirilmiş z-puanları -3,5’in altında veya 3,5’in üzerinde olan değerlerin potansiyel aykırı değerler olarak etiketlenmesini önermektedir.
Aşağıdaki adım adım örnek, belirli bir veri kümesi için değiştirilmiş z puanlarının nasıl hesaplanacağını gösterir.
1. Adım: Verileri oluşturun
16 değere sahip aşağıdaki veri kümesine sahip olduğumuzu varsayalım:
Adım 2: Medyanı Bulun
Daha sonra medyanı bulacağız. Bu, veri kümesinin orta noktasını temsil eder ve bunun 16 olduğu ortaya çıkar.
Adım 3: Her değer ile medyan arasındaki mutlak farkı bulun
Daha sonra, her bir veri değeri ile medyan arasındaki mutlak farkı bulacağız. Örneğin, ilk veri değeri ile medyan arasındaki mutlak fark şu şekilde hesaplanır:
Mutlak fark = |6 – 16| = 10
Her bir veri değeri ile medyan arasındaki mutlak farkı hesaplamak için aynı formülü kullanabiliriz:
Adım 4: Mutlak Medyan Sapmayı Bulun
Daha sonra mutlak medyan sapmayı bulacağız. Bu, ikinci sütunun medyanıdır ve 8 olduğu ortaya çıkar.
Adım 5: Her veri değeri için değiştirilmiş Z puanını bulun
Son olarak, aşağıdaki formülü kullanarak her veri değeri için değiştirilmiş z-puanını hesaplayabiliriz:
Değiştirilmiş z-puanı = 0,6745 (x i – x̃) / MAD
Örneğin, ilk veri değeri için değiştirilmiş z-puanı şu şekilde hesaplanır:
Değiştirilmiş z-puanı = 0,6745*(6-16) / 8 = -0,843
Bu formülü veri kümesindeki her değer için tekrarlayabiliriz:
Veri kümesindeki hiçbir değerin -3,5’ten küçük veya 3,5’ten büyük değiştirilmiş z puanına sahip olmadığını görebiliyoruz, dolayısıyla bu veri kümesindeki hiçbir değeri potansiyel aykırı değer olarak etiketlemiyoruz.
Aykırı değerler nasıl ele alınır?
Veri kümenizde bir aykırı değer varsa birkaç seçeneğiniz vardır:
- Aykırı değerin veri girişi hatasından kaynaklanmadığından emin olun. Bazen bir kişi verileri kaydederken yanlış veri değerini girer. Aykırı değer mevcutsa öncelikle değerin doğru girildiğini ve bunun bir hata olmadığını doğrulayın.
- Aykırı değere yeni bir değer atayın . Aykırı değerin bir veri girişi hatasının sonucu olduğu ortaya çıkarsa, ona veri kümesinin ortalaması veya medyanı gibi yeni bir değer atamaya karar verebilirsiniz.
- Aykırı olanı kaldırın. Değer gerçekten aykırı bir değerse ve genel analiziniz üzerinde önemli bir etkisi olacaksa onu kaldırmayı seçebilirsiniz. Son raporunuzda veya analizinizde aykırı bir değeri kaldırdığınızı mutlaka belirtin.