So normalisieren sie daten zwischen 0 und 100
Um Werte in einem Datensatz zwischen 0 und 100 zu normalisieren, können Sie die folgende Formel verwenden:
z i = (x i – min(x)) / (max(x) – min(x)) * 100
Gold:
- z i : der i-te normalisierte Wert im Datensatz
- x i : der i-te Wert des Datensatzes
- min(x) : Der Mindestwert im Datensatz
- max(x): Der Maximalwert im Datensatz
Angenommen, wir haben den folgenden Datensatz:
Der Mindestwert im Datensatz beträgt 12 und der Höchstwert 68.
Um den ersten Wert von 12 zu normalisieren, würden wir die zuvor geteilte Formel anwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Um den zweiten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Um den dritten Wert von 21 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Wir können genau dieselbe Formel verwenden, um jeden Wert im Originaldatensatz zwischen 0 und 100 zu normalisieren:
So normalisieren Sie Daten zwischen beliebigen Bereichen
Wir können diese Formel tatsächlich verwenden, um einen Datensatz zwischen 0 und einer beliebigen Zahl zu normalisieren:
z i = (x i – min(x)) / (max(x) – min(x)) * Q
Dabei ist Q die maximale Zahl, die für Ihre normalisierten Datenwerte gewünscht wird.
Im vorherigen Beispiel haben wir Q mit 100 gewählt, aber wir könnten einen Bereich von Datenwerten zwischen 0 und 1000 leicht normalisieren, indem wir Q mit 1000 wählen:
Um den ersten Wert von 12 zu normalisieren, würden wir die Formel anwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Um den zweiten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Um den dritten Wert von 21 zu normalisieren, würden wir dieselbe Formel verwenden:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1.000 = (21 – 12) / (68 – 12) * 100 = 160,7
Wir können genau dieselbe Formel verwenden, um jeden Wert im Originaldatensatz zwischen 0 und 1000 zu normalisieren:
Wann Daten normalisiert werden sollen
Manchmal standardisieren wir Variablen, wenn wir eine bestimmte Art von Analyse durchführen, bei der mehrere Variablen auf unterschiedlichen Skalen gemessen werden und wir möchten, dass jede Variable den gleichen Bereich hat.
Dies verhindert, dass eine Variable einen unzulässigen Einfluss hat, insbesondere wenn sie in unterschiedlichen Einheiten gemessen wird (z. B. wenn eine Variable in Zoll und eine andere in Yards gemessen wird).
Es ist auch erwähnenswert, dass wir in diesem Tutorial eine Methode namens Min-Max-Normalisierung verwendet haben, um die Datenwerte zu normalisieren.
Die beiden häufigsten Normalisierungsmethoden sind:
1. Min-Max-Normalisierung
- Zweck: Konvertiert jeden Datenwert in einen Wert zwischen 0 und 100.
- Formel: Neuer Wert = (Wert – Min) / (Max – Min) * 100
2. Durchschnittliche Normalisierung
- Zweck: Skaliert Werte so, dass der Durchschnitt aller Werte 0 und Standard ist. Entwickler ist 1.
- Formel: Neuer Wert = (Wert – Durchschnitt) / (Standardabweichung)
Zusätzliche Ressourcen
So normalisieren Sie Daten zwischen 0 und 1
So normalisieren Sie Daten in Excel
So normalisieren Sie Daten in R
So normalisieren Sie Spalten in Python