Test de Ljung-Box : définition + exemple

Par Dr. Benjamin Anderson juillet 29, 2023 Guide 0 commentaire

Le test de Ljung-Box , du nom des statisticiens Greta M. Ljung et George EP Box , est un test statistique qui vérifie si une autocorrélation existe dans une série chronologique.

Le test de Ljung-Box est largement utilisé en économétrie et dans d’autres domaines dans lesquels les données de séries chronologiques sont courantes.

Les bases du test Ljung-Box

Voici les bases du test Ljung-Box :

Hypothèses

Le test de Ljung-Box utilise les hypothèses suivantes :

H ₀ : Les résidus sont distribués indépendamment.

H _A : Les résidus ne sont pas distribués indépendamment ; ils présentent une corrélation en série.

Idéalement, nous aimerions ne pas rejeter l’hypothèse nulle. Autrement dit, nous aimerions que la valeur p du test soit supérieure à 0,05, car cela signifie que les résidus de notre modèle de série chronologique sont indépendants, ce qui est souvent une hypothèse que nous faisons lors de la création d’un modèle.

Statistique de test

La statistique du test de Ljung-Box est la suivante :

Q = n(n+2) Σp _k ² / (nk)

où:

n = taille de l’échantillon

Σ = un symbole fantaisiste qui signifie « somme » et est considéré comme la somme de 1 à h , où h est le nombre de décalages testés.

p _k = échantillon d’autocorrélation au décalage k

Région de rejet

La statistique de test Q suit une distribution du Chi carré avec h degrés de liberté ; c’est-à-dire Q ~ X ² (h).

Nous rejetons l’hypothèse nulle et disons que les résidus du modèle ne sont pas distribués indépendamment si Q > X ² _{1-α, h}

Exemple : Comment effectuer un test Ljung-Box dans R

Pour réaliser un test Ljung-Box dans R pour une série temporelle donnée, on peut utiliser la fonction Box.test() , qui utilise la notation suivante :

Box.test (x, décalage =1, type=c(« Box-Pierce », « Ljung-Box »), fitdf = 0)

où:

x : un vecteur numérique ou une série chronologique univariée
décalage : nombre de décalages spécifié
type : Test à réaliser ; les options incluent Box-Pierce et Ljung-Box
fitdf : bD degrés de liberté à soustraire si x est une série de résidus

L’exemple suivant illustre comment effectuer le test de Ljung-Box pour un vecteur arbitraire de 100 valeurs qui suivent une distribution normale avec moyenne = 0 et variance = 1 :

#make this example reproducible
set.seed(1)

#generate a list of 100 normally distributed random variables
data <- rnorm(100, 0, 1)

#conduct Ljung-Box test
Box.test(data, lag = 10, type = "Ljung")

Cela génère la sortie suivante :

Box-Ljung test

data:  data
X-squared = 6.0721, df = 10, p-value = 0.8092

La statistique de test du test est Q = 6,0721 et la valeur p du test est de 0,8092 , ce qui est bien supérieur à 0,05. Ainsi, nous ne parvenons pas à rejeter l’hypothèse nulle du test et concluons que les valeurs des données sont indépendantes.

Notez que nous avons utilisé une valeur de décalage de 10 dans cet exemple, mais vous pouvez choisir n’importe quelle valeur que vous souhaitez utiliser pour le décalage, en fonction de votre situation particulière.

Connexe : Comment effectuer un test Ljung-Box en Python

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus