Ljung-box 테스트: 정의 + 예
통계학자인 Greta M. Ljung 과 George EP Box 의 이름을 딴 Ljung-Box 테스트는 시계열에 자기상관이 존재하는지 확인하는 통계 테스트입니다.
Ljung-Box 테스트는 계량경제학 및 시계열 데이터가 일반적인 기타 분야에서 널리 사용됩니다.
Ljung-Box 테스트의 기본
Ljung-Box 테스트의 기본 사항은 다음과 같습니다.
가설
Ljung-Box 테스트는 다음과 같은 가정을 사용합니다.
H 0 : 잔차가 독립적으로 분포됩니다.
H A : 잔차는 독립적으로 분배되지 않습니다. 그들은 계열 상관관계를 나타냅니다.
이상적으로는 귀무가설을 기각하지 않는 것이 좋습니다. 즉, 테스트의 p-값이 0.05보다 커야 합니다. 이는 시계열 모델의 잔차가 독립적이라는 것을 의미하며, 이는 종종 모델을 생성할 때 가정하는 가정입니다.
테스트 통계
Ljung-Box 검정 통계량은 다음과 같습니다.
Q = n(n+2) Σp k 2 / (nk)
금:
n = 표본 크기
Σ = “합계”를 의미하고 1부터 h 까지의 합으로 간주되는 고급 기호입니다. 여기서 h 는 테스트된 오프셋 수입니다.
p k = 시차 k 에서의 자기상관 샘플
거부지역
Q 검정 통계량은 자유도가 h 인 카이제곱 분포를 따릅니다. 즉, Q~ X2 (h)입니다.
귀무 가설을 기각하고 Q > X 2 1-α, h 인 경우 모델 잔차가 독립적으로 분포되지 않는다고 말합니다.
예: R에서 Ljung-Box 테스트를 수행하는 방법
주어진 시계열에 대해 R에서 Ljung-Box 테스트를 수행하려면 다음 표기법을 사용하는 Box.test() 함수를 사용할 수 있습니다.
Box.test (x, 오프셋=1, 유형=c(“Box-Pierce”, “Ljung-Box”), fitdf = 0)
금:
- x: 수치형 벡터 또는 일변량 시계열
- 오프셋: 지정된 오프셋 수
- 유형: 수행할 테스트입니다. 옵션에는 Box-Pierce 및 Ljung-Box가 포함됩니다.
- fitdf: x가 일련의 잔기인 경우 뺄 bD 자유도
다음 예에서는 평균 = 0, 분산 = 1인 정규 분포를 따르는 100개 값의 임의 벡터에 대해 Ljung-Box 테스트를 수행하는 방법을 보여줍니다.
#make this example reproducible set.seed(1) #generate a list of 100 normally distributed random variables data <- rnorm(100, 0, 1) #conduct Ljung-Box test Box.test(data, lag = 10, type = "Ljung")
그러면 다음과 같은 출력이 생성됩니다.
Box-Ljung test data:data X-squared = 6.0721, df = 10, p-value = 0.8092
테스트의 테스트 통계량은 Q = 6.0721 이고 테스트의 p-값은 0.8092 로 0.05보다 훨씬 높습니다. 따라서 검정의 귀무가설을 기각하고 데이터 값이 독립적이라는 결론을 내리지 못합니다.
이 예에서는 오프셋 값 10을 사용했지만 특정 상황에 따라 오프셋에 사용하려는 값을 선택할 수 있습니다.