So normalisieren sie daten zwischen -1 und 1
Um Werte in einem Datensatz zwischen -1 und 1 zu normalisieren, können Sie die folgende Formel verwenden:
z i = 2 * ((x i – x min ) / (x max – x min )) – 1
Gold:
- z i : der i-te normalisierte Wert im Datensatz
- x i : der i-te Wert des Datensatzes
- x min : Der Mindestwert im Datensatz
- x max : Der Maximalwert im Datensatz
Angenommen, wir haben den folgenden Datensatz:
Der Mindestwert im Datensatz beträgt 13 und der Höchstwert 71.
Um den ersten Wert von 13 zu normalisieren, würden wir die zuvor geteilte Formel anwenden:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
Um den zweiten Wert von 16 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897
Um den dritten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793
Wir können genau dieselbe Formel verwenden, um jeden Wert im Originaldatensatz zwischen -1 und 1 zu normalisieren:
Jeder Wert im normalisierten Datensatz liegt jetzt zwischen -1 und 1.
Mit dieser Normalisierungsmethode sind die folgenden Aussagen immer wahr:
- Der normalisierte Wert für den Mindestwert im Datensatz ist immer -1.
- Der normalisierte Wert für den Maximalwert im Datensatz ist immer 1.
- Normalisierte Werte für alle anderen Werte im Datensatz liegen zwischen -1 und 1.
Wann Daten normalisiert werden sollen
Oftmals standardisieren wir Variablen, wenn wir eine Art Analyse durchführen, bei der wir mehrere Variablen auf unterschiedlichen Skalen messen und möchten, dass jede der Variablen denselben Bereich hat.
Dies verhindert, dass eine Variable einen zu großen Einfluss hat, insbesondere wenn sie in unterschiedlichen Einheiten gemessen wird (z. B. wenn eine Variable in Zoll und eine andere in Yards gemessen wird).
Beachten Sie auch, dass die hier verwendete Normalisierungsmethode nur eine mögliche Option ist.
In manchen Fällen ist es sinnvoll, Variablen zwischen 0 und 1 oder sogar zwischen 0 und 100 zu normalisieren.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere Arten der Normalisierung durchführen:
So normalisieren Sie Daten zwischen 0 und 1
So normalisieren Sie Daten zwischen 0 und 100