Test de Ljung-Box : définition + exemple
Le test de Ljung-Box , du nom des statisticiens Greta M. Ljung et George EP Box , est un test statistique qui vérifie si une autocorrélation existe dans une série chronologique.
Le test de Ljung-Box est largement utilisé en économétrie et dans d’autres domaines dans lesquels les données de séries chronologiques sont courantes.
Les bases du test Ljung-Box
Voici les bases du test Ljung-Box :
Hypothèses
Le test de Ljung-Box utilise les hypothèses suivantes :
H 0 : Les résidus sont distribués indépendamment.
H A : Les résidus ne sont pas distribués indépendamment ; ils présentent une corrélation en série.
Idéalement, nous aimerions ne pas rejeter l’hypothèse nulle. Autrement dit, nous aimerions que la valeur p du test soit supérieure à 0,05, car cela signifie que les résidus de notre modèle de série chronologique sont indépendants, ce qui est souvent une hypothèse que nous faisons lors de la création d’un modèle.
Statistique de test
La statistique du test de Ljung-Box est la suivante :
Q = n(n+2) Σp k 2 / (nk)
où:
n = taille de l’échantillon
Σ = un symbole fantaisiste qui signifie « somme » et est considéré comme la somme de 1 à h , où h est le nombre de décalages testés.
p k = échantillon d’autocorrélation au décalage k
Région de rejet
La statistique de test Q suit une distribution du Chi carré avec h degrés de liberté ; c’est-à-dire Q ~ X 2 (h).
Nous rejetons l’hypothèse nulle et disons que les résidus du modèle ne sont pas distribués indépendamment si Q > X 2 1-α, h
Exemple : Comment effectuer un test Ljung-Box dans R
Pour réaliser un test Ljung-Box dans R pour une série temporelle donnée, on peut utiliser la fonction Box.test() , qui utilise la notation suivante :
Box.test (x, décalage =1, type=c(« Box-Pierce », « Ljung-Box »), fitdf = 0)
où:
- x : un vecteur numérique ou une série chronologique univariée
- décalage : nombre de décalages spécifié
- type : Test à réaliser ; les options incluent Box-Pierce et Ljung-Box
- fitdf : bD degrés de liberté à soustraire si x est une série de résidus
L’exemple suivant illustre comment effectuer le test de Ljung-Box pour un vecteur arbitraire de 100 valeurs qui suivent une distribution normale avec moyenne = 0 et variance = 1 :
#make this example reproducible set.seed(1) #generate a list of 100 normally distributed random variables data <- rnorm(100, 0, 1) #conduct Ljung-Box test Box.test(data, lag = 10, type = "Ljung")
Cela génère la sortie suivante :
Box-Ljung test data: data X-squared = 6.0721, df = 10, p-value = 0.8092
La statistique de test du test est Q = 6,0721 et la valeur p du test est de 0,8092 , ce qui est bien supérieur à 0,05. Ainsi, nous ne parvenons pas à rejeter l’hypothèse nulle du test et concluons que les valeurs des données sont indépendantes.
Notez que nous avons utilisé une valeur de décalage de 10 dans cet exemple, mais vous pouvez choisir n’importe quelle valeur que vous souhaitez utiliser pour le décalage, en fonction de votre situation particulière.