Jak normalizować dane od 0 do 100


Aby znormalizować wartości w zbiorze danych od 0 do 100, możesz użyć następującej formuły:

z i = (x i – min(x)) / (max(x) – min(x)) * 100

Złoto:

  • z i : i-ta znormalizowana wartość w zbiorze danych
  • x i : i-ta wartość zbioru danych
  • min(x) : Minimalna wartość w zbiorze danych
  • max(x): Maksymalna wartość w zbiorze danych

Załóżmy na przykład, że mamy następujący zestaw danych:

Minimalna wartość w zbiorze danych to 12, a maksymalna wartość to 68.

Aby znormalizować pierwszą wartość 12 , zastosowalibyśmy udostępnioną wcześniej formułę:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

Aby znormalizować drugą wartość 19 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5

Aby znormalizować trzecią wartość 21 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07

Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 100:

Normalizuj dane w zakresie od 0 do 100

Jak normalizować dane w dowolnym zakresie

W rzeczywistości możemy użyć tej formuły do normalizacji zbioru danych od 0 do dowolnej liczby:

z i = (x i – min(x)) / (max(x) – min(x)) * Q

gdzie Q jest maksymalną liczbą wymaganą dla znormalizowanych wartości danych.

W poprzednim przykładzie wybraliśmy Q na 100, ale moglibyśmy łatwo znormalizować zakres wartości danych od 0 do 1000, wybierając Q na 1000:

Aby znormalizować pierwszą wartość 12 , zastosowalibyśmy wzór:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

Aby znormalizować drugą wartość 19 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

Aby znormalizować trzecią wartość 21 , użylibyśmy tego samego wzoru:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7

Możemy użyć dokładnie tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych w zakresie od 0 do 1000:

Normalizuj dane między dwiema liczbami

Kiedy normalizować dane

Czasami standaryzujemy zmienne, gdy przeprowadzamy pewien rodzaj analizy, w której mamy wiele zmiennych mierzonych w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.

Zapobiega to wywieraniu przez jedną zmienną niepożądanego wpływu, zwłaszcza jeśli jest ona mierzona w różnych jednostkach (tzn. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).

Warto również zauważyć, że w tym samouczku zastosowaliśmy metodę znaną jako normalizacja min-max, aby znormalizować wartości danych.

Dwie najpopularniejsze metody normalizacji to:

1. Normalizacja Min-Max

  • Cel: Konwertuje każdą wartość danych na wartość z zakresu od 0 do 100.
  • Wzór: Nowa wartość = (wartość – min) / (max – min) * 100

2. Średnia normalizacja

  • Cel: Skaluje wartości w taki sposób, aby średnia wszystkich wartości wynosiła 0 i std. rozw. jest 1.
  • Wzór: Nowa wartość = (wartość – średnia) / (odchylenie standardowe)

Dodatkowe zasoby

Jak normalizować dane między 0 a 1
Jak normalizować dane w programie Excel
Jak normalizować dane w R
Jak normalizować kolumny w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *