0 ile 1 arasındaki veriler nasıl normalleştirilir?
0 ile 1 arasındaki bir veri kümesindeki değerleri normalleştirmek için aşağıdaki formülü kullanabilirsiniz:
z ben = (x i – min(x)) / (maks(x) – min(x))
Altın:
- z i : veri kümesindeki i’inci normalleştirilmiş değer
- x i : veri kümesinin i’inci değeri
- min(x) : Veri kümesindeki minimum değer
- max(x): Veri kümesindeki maksimum değer
Örneğin aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri setindeki minimum değer 13, maksimum değer ise 71’dir.
13’ün ilk değerini normalleştirmek için daha önce paylaşılan formülü uygulayacağız:
- z ben = (x ben – min(x)) / (maks(x) – min(x)) = (13 – 13) / (71 – 13) = 0
16’nın ikinci değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517
19’un üçüncü değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034
Orijinal veri kümesindeki her değeri 0 ile 1 arasında normalleştirmek için bu formülün aynısını kullanabiliriz:
Bu normalleştirme yöntemini kullanarak aşağıdaki ifadeler her zaman doğru olacaktır:
- Veri kümesindeki minimum değerin normalleştirilmiş değeri her zaman 0 olacaktır.
- Veri kümesindeki maksimum değer için normalleştirilmiş değer her zaman 1 olacaktır.
- Veri kümesindeki diğer tüm değerler için normalleştirilmiş değerler 0 ile 1 arasında olacaktır.
Veriler ne zaman normalleştirilmeli?
Farklı ölçeklerde ölçülen birden fazla değişkenin olduğu ve değişkenlerin her birinin aynı aralığa sahip olmasını istediğimiz bir tür analiz yaparken genellikle değişkenleri standartlaştırırız.
Bu, bir değişkenin, özellikle farklı birimlerle ölçülüyorsa (örneğin, bir değişken inç, diğeri yarda olarak ölçülüyorsa) aşırı etkiye sahip olmasını önler.
Bu eğitimde veri değerlerini normalleştirmek için minimum-maksimum normalleştirme olarak bilinen bir yöntem kullandığımızı da belirtmekte fayda var.
En yaygın iki normalleştirme yöntemi şunlardır:
1. Min-Maks normalizasyonu
- Amaç: Her veri değerini 0 ile 100 arasında bir değere dönüştürür.
- Formül: Yeni değer = (değer – min) / (maks – min) * 100
2. Ortalama normalizasyon
- Amaç: Değerleri, tüm değerlerin ortalaması 0 ve std olacak şekilde ölçekler. dev. 1’dir.
- Formül: Yeni değer = (değer – ortalama) / (standart sapma)
Ek kaynaklar
Aşağıdaki eğitimler, farklı istatistiksel yazılımlar kullanılarak verilerin nasıl normalleştirileceğini açıklamaktadır:
Excel’de veriler nasıl normalleştirilir
R’deki veriler nasıl normalleştirilir
Python’da sütunlar nasıl normalleştirilir