Box-cox-transformation in excel (schritt für schritt)
Eine Box-Cox-Transformation ist eine häufig verwendete Methode zur Transformation eines nicht normalverteilten Datensatzes in einennormalverteilteren Satz.
Die Grundidee besteht darin, mithilfe der folgenden Formel einen Wert für λ zu finden, sodass die transformierten Daten möglichst nahe an der Normalverteilung liegen:
- y(λ) = (y λ – 1) / λ wenn y ≠ 0
- y(λ) = log(y) wenn y = 0
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie eine Box-Cox-Transformation für einen Datensatz in Excel durchführen.
Schritt 1: Geben Sie die Daten ein
Beginnen wir mit der Eingabe von Werten aus einem Datensatz:
Schritt 2: Sortieren Sie die Daten
Erstellen Sie dann eine Indexspalte und eine sortierte Datenspalte:
Schritt 3: Wählen Sie einen beliebigen Wert für Lambda
Als nächstes wählen wir einen beliebigen Wert von 1 für Lambda und wenden eine temporäre Box-Cox-Transformation auf die Daten an:
Schritt 4: Berechnen Sie den Z-Score
Als nächstes berechnen wir den Z-Score für jeden Indexwert:
Anschließend berechnen wir die Korrelation zwischen den Box-Cox-transformierten Werten und den Z-Scores:
Schritt 5: Finden Sie den optimalen Lambda-Wert
Als nächstes verwenden wir Goal Seek, um den optimalen Lambda-Wert für die Box-Cox-Transformation zu finden.
Klicken Sie dazu im oberen Menüband auf die Registerkarte „Daten“ . Klicken Sie dann in der Gruppe Prognosen auf Was-wäre-wenn-Analyse .
Klicken Sie im Dropdown-Menü auf Zielsuche und geben Sie die folgenden Werte ein:
Sobald Sie auf „OK“ klicken, findet Goal Seek automatisch den optimalen Lambda-Wert, der bei -0,5225 liegt.
Schritt 6: Box-Cox-Transformation durchführen
Abschließend wenden wir die Box-Cox-Transformation auf die Originaldaten an und verwenden dabei einen Lambda-Wert von -0,5225:
Bonus: Wir können bestätigen, dass die transformierten Daten normalverteilt sind, indem wir einen Jarque-Bera-Test in Excel durchführen.
Zusätzliche Ressourcen
So transformieren Sie Daten in Excel (Log, Quadratwurzel, Kubikwurzel)
So berechnen Sie Z-Scores in Excel