Z puanı normalizasyonu: tanım ve örnekler
Z-puanı normalizasyonu, bir veri kümesindeki her bir değerin, tüm değerlerin ortalaması 0 ve standart sapması 1 olacak şekilde normalleştirilmesi işlemini ifade eder.
Bir veri kümesindeki her değerde z-puanı normalizasyonunu gerçekleştirmek için aşağıdaki formülü kullanırız:
Yeni değer = (x – μ) / σ
Altın:
- x : Orijinal değer
- μ : Verilerin ortalaması
- σ : Verilerin standart sapması
Aşağıdaki örnek, pratikte bir veri kümesi üzerinde z-puanı normalleştirmesinin nasıl gerçekleştirileceğini göstermektedir.
Örnek: Z-Score Normalleştirmesinin Gerçekleştirilmesi
Aşağıdaki veri setine sahip olduğumuzu varsayalım:
Hesap makinesi kullanarak veri setinin ortalamasının 21,2 , standart sapmasının ise 29,8 olduğunu görebiliriz.
Veri kümesindeki ilk değere z-puanı normalizasyonu gerçekleştirmek için aşağıdaki formülü kullanabiliriz:
- Yeni değer = (x – μ) / σ
- Yeni değer = (3 – 21,2) / 29,8
- Yeni değer = -0,61
Veri kümesindeki her değerde z-puanı normalizasyonunu gerçekleştirmek için bu formülü kullanabiliriz:
Normalleştirilmiş değerlerin ortalaması 0 , normalleştirilmiş değerlerin standart sapması 1’dir .
Normalleştirilmiş değerler, orijinal değer ile ortalama arasındaki standart sapmaların sayısını temsil eder.
Örneğin:
- Veri setindeki ilk değer ortalamanın 0,61 standart sapma altındadır.
- Veri setindeki ikinci değer ortalamanın 0,54 standart sapma altındadır.
- …
- Veri setindeki son değer ortalamanın 3,79 standart sapma üzerindedir.
Bu tür normalleştirmeyi gerçekleştirmenin avantajı, veri setindeki (134) bariz aykırı değerin, artık büyük bir aykırı değer olmayacak şekilde dönüştürülmüş olmasıdır.
Daha sonra bu veri kümesini bir tür makine öğrenimi modeline uyacak şekilde kullanırsak, aykırı değer artık model uyumu üzerinde olabileceği kadar fazla etkiye sahip olmayacaktır.
Ek kaynaklar
Aşağıdaki eğitimler farklı normalleştirme teknikleri hakkında ek bilgi sağlar:
Standardizasyon veya normalizasyon: fark nedir?
0 ile 1 arasındaki veriler nasıl normalleştirilir?
0 ile 100 arasındaki veriler nasıl normalleştirilir