Z-score-normalisierung: definition und beispiele
Unter Z-Score-Normalisierung versteht man den Prozess der Normalisierung jedes Werts in einem Datensatz, sodass der Mittelwert aller Werte 0 und die Standardabweichung 1 beträgt.
Wir verwenden die folgende Formel, um eine Z-Score-Normalisierung für jeden Wert in einem Datensatz durchzuführen:
Neuer Wert = (x – μ) / σ
Gold:
- x : Ursprünglicher Wert
- μ : Durchschnitt der Daten
- σ : Standardabweichung der Daten
Das folgende Beispiel zeigt, wie die Z-Score-Normalisierung für einen Datensatz in der Praxis durchgeführt wird.
Beispiel: Durchführen einer Z-Score-Normalisierung
Angenommen, wir haben den folgenden Datensatz:
Mit einem Taschenrechner können wir sehen, dass der Mittelwert des Datensatzes 21,2 und die Standardabweichung 29,8 beträgt.
Um eine Z-Score-Normalisierung auf den ersten Wert im Datensatz durchzuführen, können wir die folgende Formel verwenden:
- Neuer Wert = (x – μ) / σ
- Neuer Wert = (3 – 21,2) / 29,8
- Neuer Wert = -0,61
Wir können diese Formel verwenden, um eine Z-Score-Normalisierung für jeden Wert im Datensatz durchzuführen:
Der Mittelwert der normalisierten Werte beträgt 0 und die Standardabweichung der normalisierten Werte beträgt 1 .
Normalisierte Werte stellen die Anzahl der Standardabweichungen zwischen dem Originalwert und dem Mittelwert dar.
Zum Beispiel:
- Der erste Wert im Datensatz liegt 0,61 Standardabweichungen unter dem Mittelwert.
- Der zweite Wert im Datensatz liegt 0,54 Standardabweichungen unter dem Mittelwert.
- …
- Der letzte Wert im Datensatz liegt 3,79 Standardabweichungen über dem Mittelwert.
Der Vorteil dieser Art der Normalisierung besteht darin, dass der offensichtliche Ausreißer im Datensatz (134) so transformiert wurde, dass er kein massiver Ausreißer mehr ist.
Wenn wir diesen Datensatz dann verwenden, um eine Art maschinelles Lernmodell anzupassen, wird der Ausreißer nicht mehr so viel Einfluss auf die Modellanpassung haben, wie er hätte haben können.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zu verschiedenen Normalisierungstechniken:
Standardisierung oder Normalisierung: Was ist der Unterschied?
So normalisieren Sie Daten zwischen 0 und 1
So normalisieren Sie Daten zwischen 0 und 100