Box-cox-transformation in excel (schritt für schritt)


Eine Box-Cox-Transformation ist eine häufig verwendete Methode zur Transformation eines nicht normalverteilten Datensatzes in einennormalverteilteren Satz.

Die Grundidee besteht darin, mithilfe der folgenden Formel einen Wert für λ zu finden, sodass die transformierten Daten möglichst nahe an der Normalverteilung liegen:

  • y(λ) = (y λ – 1) / λ wenn y ≠ 0
  • y(λ) = log(y) wenn y = 0

Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie eine Box-Cox-Transformation für einen Datensatz in Excel durchführen.

Schritt 1: Geben Sie die Daten ein

Beginnen wir mit der Eingabe von Werten aus einem Datensatz:

Schritt 2: Sortieren Sie die Daten

Erstellen Sie dann eine Indexspalte und eine sortierte Datenspalte:

Schritt 3: Wählen Sie einen beliebigen Wert für Lambda

Als nächstes wählen wir einen beliebigen Wert von 1 für Lambda und wenden eine temporäre Box-Cox-Transformation auf die Daten an:

Schritt 4: Berechnen Sie den Z-Score

Als nächstes berechnen wir den Z-Score für jeden Indexwert:

Anschließend berechnen wir die Korrelation zwischen den Box-Cox-transformierten Werten und den Z-Scores:

Schritt 5: Finden Sie den optimalen Lambda-Wert

Als nächstes verwenden wir Goal Seek, um den optimalen Lambda-Wert für die Box-Cox-Transformation zu finden.

Klicken Sie dazu im oberen Menüband auf die Registerkarte „Daten“ . Klicken Sie dann in der Gruppe Prognosen auf Was-wäre-wenn-Analyse .

Klicken Sie im Dropdown-Menü auf Zielsuche und geben Sie die folgenden Werte ein:

Box-Cox-Transformation in Excel

Sobald Sie auf „OK“ klicken, findet Goal Seek automatisch den optimalen Lambda-Wert, der bei -0,5225 liegt.

Schritt 6: Box-Cox-Transformation durchführen

Abschließend wenden wir die Box-Cox-Transformation auf die Originaldaten an und verwenden dabei einen Lambda-Wert von -0,5225:

Bonus: Wir können bestätigen, dass die transformierten Daten normalverteilt sind, indem wir einen Jarque-Bera-Test in Excel durchführen.

Zusätzliche Ressourcen

So transformieren Sie Daten in Excel (Log, Quadratwurzel, Kubikwurzel)
So berechnen Sie Z-Scores in Excel

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert