Ljung-box-test: definition + beispiel
Der Ljung-Box-Test , benannt nach den Statistikern Greta M. Ljung und George EP Box , ist ein statistischer Test, der prüft, ob in einer Zeitreihe Autokorrelation vorliegt.
Der Ljung-Box-Test wird häufig in der Ökonometrie und anderen Bereichen verwendet, in denen Zeitreihendaten üblich sind.
Die Grundlagen des Ljung-Box-Tests
Hier sind die Grundlagen des Ljung-Box-Tests:
Hypothesen
Der Ljung-Box-Test verwendet die folgenden Annahmen:
H 0 : Die Residuen sind unabhängig voneinander verteilt.
H A : Residuen werden nicht unabhängig verteilt; sie weisen eine serielle Korrelation auf.
Im Idealfall möchten wir die Nullhypothese nicht ablehnen. Das heißt, wir möchten, dass der p-Wert des Tests größer als 0,05 ist, da dies bedeutet, dass die Residuen unseres Zeitreihenmodells unabhängig sind, was häufig eine Annahme ist, die wir bei der Erstellung eines Modells treffen.
Statistiktest
Die Ljung-Box-Teststatistik lautet wie folgt:
Q = n(n+2) Σp k 2 / (nk)
Gold:
n = Stichprobengröße
Σ = ein ausgefallenes Symbol, das „Summe“ bedeutet und als Summe von 1 bis h betrachtet wird, wobei h die Anzahl der getesteten Offsets ist.
p k = Autokorrelationsstichprobe bei Verzögerung k
Ablehnungsbereich
Die Q- Teststatistik folgt einer Chi-Quadrat-Verteilung mit h Freiheitsgraden; dh Q~ X2 (h).
Wir lehnen die Nullhypothese ab und sagen, dass die Modellresiduen nicht unabhängig verteilt sind, wenn Q > X 2 1-α, h
Beispiel: So führen Sie einen Ljung-Box-Test in R durch
Um einen Ljung-Box-Test in R für eine bestimmte Zeitreihe durchzuführen, können wir die Funktion Box.test() verwenden, die die folgende Notation verwendet:
Box.test (x, offset=1, type=c(„Box-Pierce“, „Ljung-Box“), fitdf = 0)
Gold:
- x: ein numerischer Vektor oder eine univariate Zeitreihe
- Offset: angegebene Anzahl von Offsets
- Typ: Durchzuführender Test; Zu den Optionen gehören Box-Pierce und Ljung-Box
- fitdf: bD Freiheitsgrade zum Subtrahieren, wenn x eine Reihe von Resten ist
Das folgende Beispiel veranschaulicht, wie der Ljung-Box-Test für einen beliebigen Vektor von 100 Werten durchgeführt wird, der einer Normalverteilung mit Mittelwert = 0 und Varianz = 1 folgt:
#make this example reproducible set.seed(1) #generate a list of 100 normally distributed random variables data <- rnorm(100, 0, 1) #conduct Ljung-Box test Box.test(data, lag = 10, type = "Ljung")
Dies erzeugt die folgende Ausgabe:
Box-Ljung test data:data X-squared = 6.0721, df = 10, p-value = 0.8092
Die Teststatistik des Tests beträgt Q = 6,0721 und der p-Wert des Tests beträgt 0,8092 , was viel höher als 0,05 ist. Daher können wir die Nullhypothese des Tests nicht ablehnen und daraus schließen, dass die Datenwerte unabhängig sind.
Beachten Sie, dass wir in diesem Beispiel einen Offset-Wert von 10 verwendet haben. Sie können jedoch je nach Ihrer speziellen Situation einen beliebigen Wert für den Offset verwenden.
Verwandte Themen: So führen Sie einen Ljung-Box-Test in Python durch