So transformieren sie daten in excel (log, quadratwurzel, kubikwurzel)


Viele statistische Tests gehen davon aus, dass Datensätze normalverteilt sind.

Allerdings wird diese Annahme in der Praxis häufig verletzt. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, die Werte im Datensatz mithilfe einer der folgenden drei Transformationen zu transformieren:

1. Log-Transformation: Transformieren Sie y-Werte in log(y) .

2. Quadratwurzeltransformation: Transformieren Sie y-Werte in √y .

3. Kubikwurzeltransformation: Transformieren Sie y-Werte in y 1/3 .

Durch die Durchführung dieser Transformationen nähern sich die Daten im Allgemeinen der Normalverteilung an. Die folgenden Beispiele zeigen, wie diese Transformationen in Excel durchgeführt werden.

Protokolltransformation in Excel

Um eine Protokolltransformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion =LOG10() verwenden.

Der folgende Screenshot zeigt, wie Sie eine Protokolltransformation auf einen Datensatz in Excel anwenden:

Um festzustellen, ob diese Transformation den Datensatz normaler verteilt hat, können wir in Excel einen Jarque-Bera-Normalitätstest durchführen.

Die Teststatistik für diesen Test ist definiert als:

JB =(n/6) * (S 2 + (C 2 /4))

Gold:

  • n: die Anzahl der Beobachtungen in der Stichprobe
  • S: die Asymmetrie der Probe
  • C: das schmeichelhafte Muster

Unter der Nullhypothese der Normalität ist JB ~ X 2 (2).

Wenn der p-Wert , der der Teststatistik entspricht, unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), können wir die Nullhypothese ablehnen und daraus schließen, dass die Daten nicht normalverteilt sind.

Der folgende Screenshot zeigt, wie ein Jarque-Bera-Test für Rohdaten und transformierte Daten durchgeführt wird:

Speichern Sie transformierte Daten in Excel

Beachten Sie, dass der p-Wert der Rohdaten kleiner als 0,05 ist, was darauf hinweist, dass sie nicht normalverteilt sind .

Der p-Wert der transformierten Daten beträgt jedoch nicht weniger als 0,05, sodass wir davon ausgehen können, dass sie normalverteilt sind . Dies zeigt uns, dass die Protokolltransformation funktioniert hat.

Quadratwurzeltransformation in Excel

Um eine Quadratwurzeltransformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion =SQRT() verwenden.

Der folgende Screenshot zeigt, wie Sie eine Quadratwurzeltransformation auf einen Datensatz in Excel anwenden:

Quadratwurzeltransformation in Excel

Beachten Sie, dass der p-Wert des Jarque-Bera-Normalitätstests für die transformierten Daten nicht weniger als 0,05 beträgt, was darauf hinweist, dass die Quadratwurzeltransformation effektiv war.

Würfelwurzeltransformation in Excel

Um eine Kubikwurzeltransformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion =DATA^(1/3) verwenden.

Der folgende Screenshot zeigt, wie Sie eine Kubikwurzeltransformation auf einen Datensatz in Excel anwenden:

Würfelwurzeltransformation in Excel

Der p-Wert des Jarque-Bera-Normalitätstests für die transformierten Daten beträgt nicht weniger als 0,05, was darauf hinweist, dass die Kubikwurzeltransformation effektiv war.

Durch die drei Datentransformationen wurden die Rohdaten effektiv normaler verteilt.

Von den drei Transformationen ergab die logarithmische Transformation den höchsten p-Wert im Jarque-Bera-Normalitätstest, was uns sagt, dass sie die Daten wahrscheinlich zu den „normalsten“ normalverteilten Daten unter den drei Transformationsmethoden machte.

Zusätzliche Ressourcen

So führen Sie eine Box-Cox-Transformation in Excel durch
Was ist die Normalitätsannahme in der Statistik?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert