Ljung-box-test: definitie + voorbeeld


De Ljung-Box-test , genoemd naar de statistici Greta M. Ljung en George EP Box , is een statistische test die controleert of er autocorrelatie bestaat in een tijdreeks.

De Ljung-Box-test wordt veel gebruikt in de econometrie en andere gebieden waarin tijdreeksgegevens gebruikelijk zijn.

De basis van de Ljung-Box-test

Hier zijn de basisprincipes van de Ljung-Box-test:

Hypotheses

De Ljung-Box-test maakt gebruik van de volgende aannames:

H 0 : De residuen worden onafhankelijk verdeeld.

H A : Residuen worden niet onafhankelijk gedistribueerd; ze vertonen seriële correlatie.

Idealiter zouden we de nulhypothese niet willen verwerpen. Dat wil zeggen dat we graag willen dat de p-waarde van de test groter is dan 0,05, omdat dit betekent dat de residuen van ons tijdreeksmodel onafhankelijk zijn, wat vaak een aanname is die we maken bij het maken van een model.

Teststatistiek

De Ljung-Box-teststatistiek is als volgt:

Q = n(n+2) Σp k 2 / (nk)

Goud:

n = steekproefomvang

Σ = een mooi symbool dat „som“ betekent en wordt beschouwd als de som van 1 tot h , waarbij h het aantal geteste offsets is.

p k = autocorrelatiemonster bij lag k

Afwijzingsregio

De Q- teststatistiek volgt een Chi-kwadraatverdeling met h vrijheidsgraden; dat wil zeggen Q~ X2 (h).

We verwerpen de nulhypothese en zeggen dat de modelresiduen niet onafhankelijk verdeeld zijn als Q > X 2 1-α, h

Voorbeeld: een Ljung-Box-test uitvoeren in R

Om een Ljung-Box-test in R uit te voeren voor een bepaalde tijdreeks, kunnen we de functie Box.test() gebruiken, die de volgende notatie gebruikt:

Box.test (x, offset=1, type=c(“Box-Pierce”, “Ljung-Box”), fitdf = 0)

Goud:

  • x: een numerieke vector of univariate tijdreeks
  • offset: gespecificeerd aantal offsets
  • type: Uit te voeren test; opties zijn onder meer Box-Pierce en Ljung-Box
  • fitdf: bD vrijheidsgraden om af te trekken als x een reeks residuen is

Het volgende voorbeeld illustreert hoe u de Ljung-Box-test uitvoert voor een willekeurige vector van 100 waarden die een normale verdeling volgt met gemiddelde = 0 en variantie = 1:

 #make this example reproducible
set.seed(1)

#generate a list of 100 normally distributed random variables
data <- rnorm(100, 0, 1)

#conduct Ljung-Box test
Box.test(data, lag = 10, type = "Ljung")

Dit genereert de volgende uitvoer:

 Box-Ljung test

data:data
X-squared = 6.0721, df = 10, p-value = 0.8092

De teststatistiek van de test is Q = 6,0721 en de p-waarde van de test is 0,8092 , wat veel hoger is dan 0,05. We slagen er dus niet in de nulhypothese van de test te verwerpen en concluderen dat de gegevenswaarden onafhankelijk zijn.

Houd er rekening mee dat we in dit voorbeeld een offsetwaarde van 10 hebben gebruikt, maar u kunt elke waarde kiezen die u voor de offset wilt gebruiken, afhankelijk van uw specifieke situatie.

Gerelateerd:Een Ljung-Box-test uitvoeren in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert