Normalizacja wyniku z: definicja i przykłady
Normalizacja wyniku Z odnosi się do procesu normalizacji każdej wartości w zestawie danych w taki sposób, że średnia wszystkich wartości wynosi 0, a odchylenie standardowe wynosi 1.
Aby przeprowadzić normalizację wyniku Z dla każdej wartości w zbiorze danych, używamy następującej formuły:
Nowa wartość = (x – μ) / σ
Złoto:
- x : Wartość oryginalna
- μ : Średnia danych
- σ : Odchylenie standardowe danych
Poniższy przykład pokazuje, jak w praktyce przeprowadzić normalizację wyniku Z na zestawie danych.
Przykład: przeprowadzanie normalizacji wyniku Z
Załóżmy, że mamy następujący zbiór danych:
Korzystając z kalkulatora, możemy zobaczyć, że średnia zbioru danych wynosi 21,2 , a odchylenie standardowe wynosi 29,8 .
Aby przeprowadzić normalizację wyniku Z do pierwszej wartości w zbiorze danych, możemy użyć następującego wzoru:
- Nowa wartość = (x – μ) / σ
- Nowa wartość = (3 – 21,2) / 29,8
- Nowa wartość = -0,61
Możemy użyć tej formuły, aby przeprowadzić normalizację wyniku Z dla każdej wartości w zbiorze danych:
Średnia znormalizowanych wartości wynosi 0 , a odchylenie standardowe znormalizowanych wartości wynosi 1 .
Znormalizowane wartości reprezentują liczbę odchyleń standardowych między wartością pierwotną a średnią.
Na przykład:
- Pierwsza wartość w zbiorze danych wynosi 0,61 odchylenia standardowego poniżej średniej.
- Druga wartość w zbiorze danych wynosi 0,54 odchylenia standardowego poniżej średniej.
- …
- Ostatnia wartość w zbiorze danych wynosi 3,79 odchylenia standardowego powyżej średniej.
Zaletą wykonywania tego typu normalizacji jest to, że oczywista wartość odstająca w zbiorze danych (134) została przekształcona w taki sposób, że nie jest już masową wartością odstającą.
Jeśli następnie użyjemy tego zbioru danych do dopasowania pewnego rodzaju modelu uczenia maszynowego , wartość odstająca nie będzie już miała tak dużego wpływu, jak mogłaby mieć na dopasowanie modelu.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat różnych technik normalizacji:
Standaryzacja czy normalizacja: jaka jest różnica?
Jak normalizować dane między 0 a 1
Jak normalizować dane od 0 do 100