So normalisieren sie daten zwischen 0 und 1


Um Werte in einem Datensatz zwischen 0 und 1 zu normalisieren, können Sie die folgende Formel verwenden:

z i = (x i – min(x)) / (max(x) – min(x))

Gold:

  • z i : der i-te normalisierte Wert im Datensatz
  • x i : der i-te Wert des Datensatzes
  • min(x) : Der Mindestwert im Datensatz
  • max(x): Der Maximalwert im Datensatz

Angenommen, wir haben den folgenden Datensatz:

Der Mindestwert im Datensatz beträgt 13 und der Höchstwert 71.

Um den ersten Wert von 13 zu normalisieren, würden wir die zuvor geteilte Formel anwenden:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0

Um den zweiten Wert von 16 zu normalisieren, würden wir dieselbe Formel verwenden:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

Um den dritten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Wir können genau dieselbe Formel verwenden, um jeden Wert im Originaldatensatz zwischen 0 und 1 zu normalisieren:

Daten zwischen 0 und 1 normalisieren

Mit dieser Normalisierungsmethode sind die folgenden Aussagen immer wahr:

  • Der normalisierte Wert für den Mindestwert im Datensatz ist immer 0.
  • Der normalisierte Wert für den Maximalwert im Datensatz ist immer 1.
  • Normalisierte Werte für alle anderen Werte im Datensatz liegen zwischen 0 und 1.

Wann Daten normalisiert werden sollen

Oftmals standardisieren wir Variablen, wenn wir eine Art Analyse durchführen, bei der wir mehrere Variablen auf unterschiedlichen Skalen messen und möchten, dass jede der Variablen denselben Bereich hat.

Dies verhindert, dass eine Variable einen unzulässigen Einfluss hat, insbesondere wenn sie in unterschiedlichen Einheiten gemessen wird (z. B. wenn eine Variable in Zoll und eine andere in Yards gemessen wird).

Es ist auch erwähnenswert, dass wir in diesem Tutorial eine Methode namens Min-Max-Normalisierung verwendet haben, um die Datenwerte zu normalisieren.

Die beiden häufigsten Normalisierungsmethoden sind:

1. Min-Max-Normalisierung

  • Zweck: Konvertiert jeden Datenwert in einen Wert zwischen 0 und 100.
  • Formel: Neuer Wert = (Wert – Min) / (Max – Min) * 100

2. Durchschnittliche Normalisierung

  • Zweck: Skaliert Werte so, dass der Durchschnitt aller Werte 0 und Standard ist. Entwickler ist 1.
  • Formel: Neuer Wert = (Wert – Durchschnitt) / (Standardabweichung)

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie Daten mit unterschiedlicher Statistiksoftware normalisieren:

So normalisieren Sie Daten in Excel
So normalisieren Sie Daten in R
So normalisieren Sie Spalten in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert