0 ile 1 arasındaki veriler nasıl normalleştirilir?


0 ile 1 arasındaki bir veri kümesindeki değerleri normalleştirmek için aşağıdaki formülü kullanabilirsiniz:

z ben = (x i – min(x)) / (maks(x) – min(x))

Altın:

  • z i : veri kümesindeki i’inci normalleştirilmiş değer
  • x i : veri kümesinin i’inci değeri
  • min(x) : Veri kümesindeki minimum değer
  • max(x): Veri kümesindeki maksimum değer

Örneğin aşağıdaki veri setine sahip olduğumuzu varsayalım:

Veri setindeki minimum değer 13, maksimum değer ise 71’dir.

13’ün ilk değerini normalleştirmek için daha önce paylaşılan formülü uygulayacağız:

  • z ben = (x ben – min(x)) / (maks(x) – min(x)) = (13 – 13) / (71 – 13) = 0

16’nın ikinci değerini normalleştirmek için aynı formülü kullanırız:

  • z ben = (x i – min(x)) / (maks(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

19’un üçüncü değerini normalleştirmek için aynı formülü kullanırız:

  • z ben = (x i – min(x)) / (maks(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Orijinal veri kümesindeki her değeri 0 ile 1 arasında normalleştirmek için bu formülün aynısını kullanabiliriz:

Verileri 0 ile 1 arasında normalleştirin

Bu normalleştirme yöntemini kullanarak aşağıdaki ifadeler her zaman doğru olacaktır:

  • Veri kümesindeki minimum değerin normalleştirilmiş değeri her zaman 0 olacaktır.
  • Veri kümesindeki maksimum değer için normalleştirilmiş değer her zaman 1 olacaktır.
  • Veri kümesindeki diğer tüm değerler için normalleştirilmiş değerler 0 ile 1 arasında olacaktır.

Veriler ne zaman normalleştirilmeli?

Farklı ölçeklerde ölçülen birden fazla değişkenin olduğu ve değişkenlerin her birinin aynı aralığa sahip olmasını istediğimiz bir tür analiz yaparken genellikle değişkenleri standartlaştırırız.

Bu, bir değişkenin, özellikle farklı birimlerle ölçülüyorsa (örneğin, bir değişken inç, diğeri yarda olarak ölçülüyorsa) aşırı etkiye sahip olmasını önler.

Bu eğitimde veri değerlerini normalleştirmek için minimum-maksimum normalleştirme olarak bilinen bir yöntem kullandığımızı da belirtmekte fayda var.

En yaygın iki normalleştirme yöntemi şunlardır:

1. Min-Maks normalizasyonu

  • Amaç: Her veri değerini 0 ile 100 arasında bir değere dönüştürür.
  • Formül: Yeni değer = (değer – min) / (maks – min) * 100

2. Ortalama normalizasyon

  • Amaç: Değerleri, tüm değerlerin ortalaması 0 ve std olacak şekilde ölçekler. dev. 1’dir.
  • Formül: Yeni değer = (değer – ortalama) / (standart sapma)

Ek kaynaklar

Aşağıdaki eğitimler, farklı istatistiksel yazılımlar kullanılarak verilerin nasıl normalleştirileceğini açıklamaktadır:

Excel’de veriler nasıl normalleştirilir
R’deki veriler nasıl normalleştirilir
Python’da sütunlar nasıl normalleştirilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir