Jak normalizować dane między -1 a 1
Aby znormalizować wartości w zbiorze danych od -1 do 1, możesz użyć następującej formuły:
z ja = 2 * ((x i – x min ) / (x max – x min )) – 1
Złoto:
- z i : i-ta znormalizowana wartość w zbiorze danych
- x i : i-ta wartość zbioru danych
- x min : Minimalna wartość w zbiorze danych
- x max : Maksymalna wartość w zbiorze danych
Załóżmy na przykład, że mamy następujący zestaw danych:
Minimalna wartość w zbiorze danych to 13, a maksymalna wartość to 71.
Aby znormalizować pierwszą wartość 13 , zastosowalibyśmy udostępnioną wcześniej formułę:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
Aby znormalizować drugą wartość 16 , użylibyśmy tego samego wzoru:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897
Aby znormalizować trzecią wartość 19 , użylibyśmy tego samego wzoru:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793
Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych pomiędzy -1 a 1:
Każda wartość w znormalizowanym zbiorze danych mieści się teraz w przedziale od -1 do 1.
Stosując tę metodę normalizacji, następujące stwierdzenia będą zawsze prawdziwe:
- Znormalizowana wartość minimalnej wartości w zbiorze danych będzie zawsze wynosić -1.
- Znormalizowana wartość maksymalnej wartości w zbiorze danych będzie zawsze wynosić 1.
- Znormalizowane wartości dla wszystkich pozostałych wartości w zbiorze danych będą wynosić od -1 do 1.
Kiedy normalizować dane
Często standaryzujemy zmienne, gdy przeprowadzamy analizę, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.
Zapobiega to wywieraniu przez jedną zmienną zbyt dużego wpływu, zwłaszcza jeśli jest mierzona w różnych jednostkach (tj. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).
Należy również pamiętać, że zastosowana tutaj metoda normalizacji jest tylko jedną z możliwych opcji.
W niektórych przypadkach sensowne jest normalizowanie zmiennych z zakresu od 0 do 1, a nawet od 0 do 100.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typy normalizacji:
Jak normalizować dane między 0 a 1
Jak normalizować dane od 0 do 100