Teste ljung-box: definição + exemplo
O teste Ljung-Box , em homenagem aos estatísticos Greta M. Ljung e George EP Box , é um teste estatístico que verifica se existe autocorrelação em uma série temporal.
O teste Ljung-Box é amplamente utilizado em econometria e outros campos nos quais dados de séries temporais são comuns.
Os princípios básicos do teste Ljung-Box
Aqui estão os princípios básicos do teste Ljung-Box:
Hipóteses
O teste Ljung-Box utiliza as seguintes suposições:
H 0 : Os resíduos são distribuídos de forma independente.
HA : Os resíduos não são distribuídos de forma independente; eles exibem correlação serial.
Idealmente, gostaríamos de não rejeitar a hipótese nula. Ou seja, gostaríamos que o valor p do teste fosse maior que 0,05, pois isso significa que os resíduos do nosso modelo de série temporal são independentes, o que muitas vezes é uma suposição que fazemos ao criar um modelo.
Estatística de teste
A estatística do teste Ljung-Box é a seguinte:
Q = n(n+2) Σp k 2 / (nk)
Ouro:
n = tamanho da amostra
Σ = um símbolo sofisticado que significa “soma” e é considerado a soma de 1 a h , onde h é o número de deslocamentos testados.
p k = amostra de autocorrelação no atraso k
Região de rejeição
A estatística do teste Q segue uma distribuição qui-quadrado com h graus de liberdade; ou seja, Q~ X2 (h).
Rejeitamos a hipótese nula e dizemos que os resíduos do modelo não são distribuídos independentemente se Q > X 2 1-α, h
Exemplo: Como realizar um teste Ljung-Box em R
Para realizar um teste Ljung-Box em R para uma determinada série temporal, podemos usar a função Box.test() , que utiliza a seguinte notação:
Box.test (x, deslocamento = 1, tipo = c (“Box-Pierce”, “Ljung-Box”), fitdf = 0)
Ouro:
- x: um vetor numérico ou série temporal univariada
- offset: número especificado de deslocamentos
- tipo: Teste a ser realizado; as opções incluem Box-Pierce e Ljung-Box
- fitdf: bD graus de liberdade para subtrair se x for uma série de resíduos
O exemplo a seguir ilustra como realizar o teste Ljung-Box para um vetor arbitrário de 100 valores que segue uma distribuição normal com média = 0 e variância = 1:
#make this example reproducible set.seed(1) #generate a list of 100 normally distributed random variables data <- rnorm(100, 0, 1) #conduct Ljung-Box test Box.test(data, lag = 10, type = "Ljung")
Isso gera a seguinte saída:
Box-Ljung test data:data X-squared = 6.0721, df = 10, p-value = 0.8092
A estatística de teste do teste é Q = 6,0721 e o valor p do teste é 0,8092 , que é muito superior a 0,05. Assim, deixamos de rejeitar a hipótese nula do teste e concluímos que os valores dos dados são independentes.
Observe que usamos um valor de deslocamento de 10 neste exemplo, mas você pode escolher qualquer valor que queira usar para o deslocamento, dependendo da sua situação específica.
Relacionado: Como realizar um teste Ljung-Box em Python