Jak normalizować dane między 0 a 1


Aby znormalizować wartości w zbiorze danych od 0 do 1, możesz użyć następującej formuły:

z i = (x i – min(x)) / (max(x) – min(x))

Złoto:

  • z i : i-ta znormalizowana wartość w zbiorze danych
  • x i : i-ta wartość zbioru danych
  • min(x) : Minimalna wartość w zbiorze danych
  • max(x): Maksymalna wartość w zbiorze danych

Załóżmy na przykład, że mamy następujący zestaw danych:

Minimalna wartość w zbiorze danych to 13, a maksymalna wartość to 71.

Aby znormalizować pierwszą wartość 13 , zastosowalibyśmy udostępnioną wcześniej formułę:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0

Aby znormalizować drugą wartość 16 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

Aby znormalizować trzecią wartość 19 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 1:

Normalizuj dane w zakresie od 0 do 1

Stosując tę metodę normalizacji, następujące stwierdzenia będą zawsze prawdziwe:

  • Znormalizowana wartość minimalnej wartości w zbiorze danych będzie zawsze wynosić 0.
  • Znormalizowana wartość maksymalnej wartości w zbiorze danych będzie zawsze wynosić 1.
  • Znormalizowane wartości dla wszystkich pozostałych wartości w zbiorze danych będą wynosić od 0 do 1.

Kiedy normalizować dane

Często standaryzujemy zmienne, gdy przeprowadzamy analizę, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.

Zapobiega to wywieraniu przez jedną zmienną niepożądanego wpływu, zwłaszcza jeśli jest ona mierzona w różnych jednostkach (tzn. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).

Warto również zauważyć, że w tym samouczku zastosowaliśmy metodę znaną jako normalizacja min-max, aby znormalizować wartości danych.

Dwie najpopularniejsze metody normalizacji to:

1. Normalizacja Min-Max

  • Cel: Konwertuje każdą wartość danych na wartość z zakresu od 0 do 100.
  • Wzór: Nowa wartość = (wartość – min) / (max – min) * 100

2. Średnia normalizacja

  • Cel: Skaluje wartości w taki sposób, aby średnia wszystkich wartości wynosiła 0 i std. rozw. jest 1.
  • Wzór: Nowa wartość = (wartość – średnia) / (odchylenie standardowe)

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak normalizować dane przy użyciu różnych programów statystycznych:

Jak normalizować dane w programie Excel
Jak normalizować dane w R
Jak normalizować kolumny w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *