Jak normalizować dane między 0 a 1
Aby znormalizować wartości w zbiorze danych od 0 do 1, możesz użyć następującej formuły:
z i = (x i – min(x)) / (max(x) – min(x))
Złoto:
- z i : i-ta znormalizowana wartość w zbiorze danych
- x i : i-ta wartość zbioru danych
- min(x) : Minimalna wartość w zbiorze danych
- max(x): Maksymalna wartość w zbiorze danych
Załóżmy na przykład, że mamy następujący zestaw danych:
Minimalna wartość w zbiorze danych to 13, a maksymalna wartość to 71.
Aby znormalizować pierwszą wartość 13 , zastosowalibyśmy udostępnioną wcześniej formułę:
- z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0
Aby znormalizować drugą wartość 16 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517
Aby znormalizować trzecią wartość 19 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034
Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 1:
Stosując tę metodę normalizacji, następujące stwierdzenia będą zawsze prawdziwe:
- Znormalizowana wartość minimalnej wartości w zbiorze danych będzie zawsze wynosić 0.
- Znormalizowana wartość maksymalnej wartości w zbiorze danych będzie zawsze wynosić 1.
- Znormalizowane wartości dla wszystkich pozostałych wartości w zbiorze danych będą wynosić od 0 do 1.
Kiedy normalizować dane
Często standaryzujemy zmienne, gdy przeprowadzamy analizę, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.
Zapobiega to wywieraniu przez jedną zmienną niepożądanego wpływu, zwłaszcza jeśli jest ona mierzona w różnych jednostkach (tzn. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).
Warto również zauważyć, że w tym samouczku zastosowaliśmy metodę znaną jako normalizacja min-max, aby znormalizować wartości danych.
Dwie najpopularniejsze metody normalizacji to:
1. Normalizacja Min-Max
- Cel: Konwertuje każdą wartość danych na wartość z zakresu od 0 do 100.
- Wzór: Nowa wartość = (wartość – min) / (max – min) * 100
2. Średnia normalizacja
- Cel: Skaluje wartości w taki sposób, aby średnia wszystkich wartości wynosiła 0 i std. rozw. jest 1.
- Wzór: Nowa wartość = (wartość – średnia) / (odchylenie standardowe)
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak normalizować dane przy użyciu różnych programów statystycznych:
Jak normalizować dane w programie Excel
Jak normalizować dane w R
Jak normalizować kolumny w Pythonie