Teste dickey-fuller aumentado em r (com exemplo)
Uma série temporal é dita “estacionária” se não tem tendência, apresenta uma variância constante ao longo do tempo e tem uma estrutura de autocorrelação constante ao longo do tempo.
Uma maneira de testar se uma série temporal é estacionária é realizar um teste Dickey-Fuller aumentado , que usa as seguintes hipóteses nulas e alternativas:
H 0 : A série temporal é não estacionária. Em outras palavras, sua estrutura depende do tempo e sua variação não é constante ao longo do tempo.
HA : A série temporal é estacionária.
Se o valor p do teste estiver abaixo de um certo nível de significância (por exemplo, α = 0,05), então podemos rejeitar a hipótese nula e concluir que a série temporal é estacionária.
O exemplo passo a passo a seguir mostra como realizar um teste Dickey-Fuller aumentado em R para uma determinada série temporal.
Exemplo: teste Dickey-Fuller aumentado em R
Suponha que temos os seguintes dados de série temporal em R:
data <- c(3, 4, 4, 5, 6, 7, 6, 6, 7, 8, 9, 12, 10)
Antes de realizar um teste Dickey-Fuller aumentado nos dados, podemos criar um gráfico rápido para visualizar os dados:
plot(data, type=' l ')
Para realizar um teste Dickey-Fuller aumentado, podemos usar a função adf.test() da biblioteca tseries .
O código a seguir mostra como usar esta função:
library (tseries) #perform augmented Dickey-Fuller test adf.test(data) Augmented Dickey-Fuller Test data:data Dickey-Fuller = -2.2048, Lag order = 2, p-value = 0.4943 alternative hypothesis: stationary
Veja como interpretar os valores mais importantes do resultado:
- Estatística de teste: -2,2048
- Valor P: 0,4943
Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula.
Isso significa que a série temporal não é estacionária. Ou seja, sua estrutura depende do tempo e sua variação não é constante ao longo do tempo.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como realizar um teste de tendência Mann-Kendall em R
Como traçar uma série temporal em R
Como reduzir tendências de dados