So entfernen sie den trend von daten: mit beispielen
Das „Enttrenden“ von Zeitreihendaten bedeutet, einen zugrunde liegenden Trend in den Daten zu entfernen. Der Hauptgrund, warum wir dies tun möchten, besteht darin, zugrunde liegende Trends in saisonalen oder zyklischen Daten einfacher zu visualisieren.
Betrachten Sie beispielsweise die folgenden Zeitreihendaten, die den Gesamtumsatz eines Unternehmens für 20 aufeinanderfolgende Zeiträume darstellen:
Offensichtlich steigen die Umsätze im Laufe der Zeit tendenziell an, aber es scheint auch einen zyklischen oder saisonalen Trend in den Daten zu geben, wie die winzigen „Hügel“, die im Laufe der Zeit auftreten, belegen.
Um einen besseren Überblick über diesen zyklischen Trend zu erhalten, können wir die Daten deflationieren. In diesem Fall müsste der allgemeine Aufwärtstrend im Zeitverlauf entfernt werden, sodass die resultierenden Daten nur den zyklischen Trend darstellen.
Es gibt zwei gängige Methoden zum Deflationieren von Zeitreihendaten:
1. Tendenz durch Differenzierung
2. Verschlechterung durch Modellanpassung
Dieses Tutorial bietet eine kurze Erklärung jeder Methode.
Methode 1: Entspannung durch Differenzierung
Eine Möglichkeit, den Trend von Zeitreihendaten zu beseitigen, besteht darin, einfach einen neuen Datensatz zu erstellen, in dem jede Beobachtung den Unterschied zwischen sich selbst und der vorherigen Beobachtung darstellt.
Das folgende Bild zeigt beispielsweise, wie Sie die Differenzierung verwenden, um den Trend einer Datenreihe zu beseitigen.
Um den ersten Wert der trendbereinigten Zeitreihendaten zu erhalten, berechnen wir 13 – 8 = 5. Um dann den nächsten Wert zu erhalten, berechnen wir 18-13 = 5 und so weiter.
Das folgende Diagramm zeigt die ursprünglichen Zeitreihendaten:
Und dieses Diagramm zeigt die Daten ohne Trend:
Beachten Sie, wie viel einfacher es ist, den saisonalen Trend in den Zeitreihendaten in diesem Diagramm zu erkennen, da der allgemeine Aufwärtstrend entfernt wurde.
Methode 2: Verschlechterung durch Modellanpassung
Eine andere Möglichkeit, den Trend von Zeitreihendaten zu beseitigen, besteht darin, ein Regressionsmodell an die Daten anzupassen und dann die Differenz zwischen den beobachteten Werten und den vorhergesagten Werten des Modells zu berechnen.
Angenommen, wir haben denselben Datensatz:
Wenn wir ein einfaches lineares Regressionsmodell an die Daten anpassen, können wir für jede Beobachtung im Datensatz einen vorhergesagten Wert erhalten.
Wir können dann für jede Beobachtung die Differenz zwischen dem tatsächlichen Wert und dem vorhergesagten Wert ermitteln. Diese Unterschiede stellen trendbereinigte Daten dar.
Wenn wir ein Diagramm der Daten ohne Trend erstellen, können wir den saisonalen oder zyklischen Trend der Daten viel einfacher visualisieren:
Beachten Sie, dass wir in diesem Beispiel eine lineare Regression verwendet haben. Es ist jedoch möglich, eine komplexere Methode wie die exponentielle Regression zu verwenden, wenn die Daten eher einen exponentiellen Aufwärts- oder Abwärtstrend aufweisen.