0 ile 100 arasındaki veriler nasıl normalleştirilir
0 ile 100 arasındaki bir veri kümesindeki değerleri normalleştirmek için aşağıdaki formülü kullanabilirsiniz:
z ben = (x i – min(x)) / (maks(x) – min(x)) * 100
Altın:
- z i : veri kümesindeki i’inci normalleştirilmiş değer
- x i : veri kümesinin i’inci değeri
- min(x) : Veri kümesindeki minimum değer
- max(x): Veri kümesindeki maksimum değer
Örneğin aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri setindeki minimum değer 12, maksimum değer ise 68’dir.
12’nin ilk değerini normalleştirmek için daha önce paylaşılan formülü uygulayacağız:
- z ben = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
19’un ikinci değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
21’in üçüncü değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Orijinal veri kümesindeki her değeri 0 ile 100 arasında normalleştirmek için bu formülün aynısını kullanabiliriz:
Herhangi bir aralık arasındaki veriler nasıl normalleştirilir?
Aslında bu formülü 0 ile herhangi bir sayı arasındaki bir veri kümesini normalleştirmek için kullanabiliriz:
z ben = (x i – min(x)) / (maks(x) – min(x)) * Q
burada Q, normalleştirilmiş veri değerleriniz için istenen maksimum sayıdır.
Önceki örnekte Q’yu 100 olarak seçtik ancak Q’yu 1000 olarak seçerek 0 ile 1000 arasındaki veri değeri aralığını kolayca normalleştirebilirdik:
12’nin ilk değerini normalleştirmek için şu formülü uygularız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
19’un ikinci değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (maks(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
21’in üçüncü değerini normalleştirmek için aynı formülü kullanırız:
- z ben = (x i – min(x)) / (max(x) – min(x)) * 1.000 = (21 – 12) / (68 – 12) * 100 = 160,7
Orijinal veri kümesindeki her değeri 0 ile 1000 arasında normalleştirmek için bu formülün aynısını kullanabiliriz:
Veriler ne zaman normalleştirilmeli?
Bazen, farklı ölçeklerde ölçülen birden fazla değişkenin olduğu ve değişkenlerin her birinin aynı aralığa sahip olmasını istediğimiz belirli bir analiz türü yaparken değişkenleri standartlaştırırız.
Bu, bir değişkenin, özellikle farklı birimlerle ölçülüyorsa (örneğin, bir değişken inç, diğeri yarda olarak ölçülüyorsa) aşırı etkiye sahip olmasını önler.
Bu eğitimde veri değerlerini normalleştirmek için minimum-maksimum normalleştirme olarak bilinen bir yöntem kullandığımızı da belirtmekte fayda var.
En yaygın iki normalleştirme yöntemi şunlardır:
1. Min-Maks normalizasyonu
- Amaç: Her veri değerini 0 ile 100 arasında bir değere dönüştürür.
- Formül: Yeni değer = (değer – min) / (maks – min) * 100
2. Ortalama normalizasyon
- Amaç: Değerleri, tüm değerlerin ortalaması 0 ve std olacak şekilde ölçekler. dev. 1’dir.
- Formül: Yeni değer = (değer – ortalama) / (standart sapma)
Ek kaynaklar
0 ile 1 arasındaki veriler nasıl normalleştirilir?
Excel’de veriler nasıl normalleştirilir
R’deki veriler nasıl normalleştirilir
Python’da sütunlar nasıl normalleştirilir