Jak normalizować dane między -1 a 1


Aby znormalizować wartości w zbiorze danych od -1 do 1, możesz użyć następującej formuły:

z ja = 2 * ((x i – x min ) / (x max – x min )) – 1

Złoto:

  • z i : i-ta znormalizowana wartość w zbiorze danych
  • x i : i-ta wartość zbioru danych
  • x min : Minimalna wartość w zbiorze danych
  • x max : Maksymalna wartość w zbiorze danych

Załóżmy na przykład, że mamy następujący zestaw danych:

Minimalna wartość w zbiorze danych to 13, a maksymalna wartość to 71.

Aby znormalizować pierwszą wartość 13 , zastosowalibyśmy udostępnioną wcześniej formułę:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1

Aby znormalizować drugą wartość 16 , użylibyśmy tego samego wzoru:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897

Aby znormalizować trzecią wartość 19 , użylibyśmy tego samego wzoru:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793

Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych pomiędzy -1 a 1:

Każda wartość w znormalizowanym zbiorze danych mieści się teraz w przedziale od -1 do 1.

Stosując tę metodę normalizacji, następujące stwierdzenia będą zawsze prawdziwe:

  • Znormalizowana wartość minimalnej wartości w zbiorze danych będzie zawsze wynosić -1.
  • Znormalizowana wartość maksymalnej wartości w zbiorze danych będzie zawsze wynosić 1.
  • Znormalizowane wartości dla wszystkich pozostałych wartości w zbiorze danych będą wynosić od -1 do 1.

Kiedy normalizować dane

Często standaryzujemy zmienne, gdy przeprowadzamy analizę, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.

Zapobiega to wywieraniu przez jedną zmienną zbyt dużego wpływu, zwłaszcza jeśli jest mierzona w różnych jednostkach (tj. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).

Należy również pamiętać, że zastosowana tutaj metoda normalizacji jest tylko jedną z możliwych opcji.

W niektórych przypadkach sensowne jest normalizowanie zmiennych z zakresu od 0 do 1, a nawet od 0 do 100.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typy normalizacji:

Jak normalizować dane między 0 a 1
Jak normalizować dane od 0 do 100

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *