Jak normalizować dane od 0 do 100
Aby znormalizować wartości w zbiorze danych od 0 do 100, możesz użyć następującej formuły:
z i = (x i – min(x)) / (max(x) – min(x)) * 100
Złoto:
- z i : i-ta znormalizowana wartość w zbiorze danych
- x i : i-ta wartość zbioru danych
- min(x) : Minimalna wartość w zbiorze danych
- max(x): Maksymalna wartość w zbiorze danych
Załóżmy na przykład, że mamy następujący zestaw danych:
Minimalna wartość w zbiorze danych to 12, a maksymalna wartość to 68.
Aby znormalizować pierwszą wartość 12 , zastosowalibyśmy udostępnioną wcześniej formułę:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Aby znormalizować drugą wartość 19 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Aby znormalizować trzecią wartość 21 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 100:
Jak normalizować dane w dowolnym zakresie
W rzeczywistości możemy użyć tej formuły do normalizacji zbioru danych od 0 do dowolnej liczby:
z i = (x i – min(x)) / (max(x) – min(x)) * Q
gdzie Q jest maksymalną liczbą wymaganą dla znormalizowanych wartości danych.
W poprzednim przykładzie wybraliśmy Q na 100, ale moglibyśmy łatwo znormalizować zakres wartości danych od 0 do 1000, wybierając Q na 1000:
Aby znormalizować pierwszą wartość 12 , zastosowalibyśmy wzór:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Aby znormalizować drugą wartość 19 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Aby znormalizować trzecią wartość 21 , użylibyśmy tego samego wzoru:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7
Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 1000:
Kiedy normalizować dane
Czasami standaryzujemy zmienne, gdy przeprowadzamy pewien rodzaj analizy, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.
Zapobiega to wywieraniu przez jedną zmienną niepożądanego wpływu, zwłaszcza jeśli jest ona mierzona w różnych jednostkach (tzn. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).
Warto również zauważyć, że w tym samouczku zastosowaliśmy metodę znaną jako normalizacja min-max, aby znormalizować wartości danych.
Dwie najpopularniejsze metody normalizacji to:
1. Normalizacja Min-Max
- Cel: Konwertuje każdą wartość danych na wartość z zakresu od 0 do 100.
- Wzór: Nowa wartość = (wartość – min) / (max – min) * 100
2. Średnia normalizacja
- Cel: Skaluje wartości w taki sposób, aby średnia wszystkich wartości wynosiła 0 i std. rozw. jest 1.
- Wzór: Nowa wartość = (wartość – średnia) / (odchylenie standardowe)
Dodatkowe zasoby
Jak normalizować dane między 0 a 1
Jak normalizować dane w programie Excel
Jak normalizować dane w R
Jak normalizować kolumny w Pythonie