Stata에서 breusch-pagan 테스트를 수행하는 방법


다중 선형 회귀는 여러 설명 변수와 응답 변수 간의 관계를 이해하는 데 사용할 수 있는 방법입니다.

불행하게도 회귀 분석에서 자주 발생하는 문제는 이분산성(heteroscedasticity) 으로 알려져 있으며 , 측정된 값의 범위에 걸쳐 잔차의 분산이 체계적으로 변화하는 경우입니다.

이분산성이 존재하는지 확인하는 데 사용할 수 있는 테스트 중 하나는 Breusch-Pagan 테스트 입니다. 이 검정은 카이제곱 검정 통계량과 해당 p-값을 생성합니다.

p-값이 특정 임계값(일반적으로 0.01, 0.05, 0.10)보다 낮으면 이분산성이 존재한다고 말할 수 있는 충분한 증거가 있는 것입니다.

이 튜토리얼에서는 Stata에서 Breusch-Pagan 테스트를 수행하는 방법을 설명합니다.

예: Stata의 Breusch-Pagan 테스트

Breusch-Pagan 테스트를 수행하는 방법을 설명하기 위해 자동으로 통합된 Stata 데이터세트를 사용할 것입니다.

1단계: 데이터를 로드하고 표시합니다.

먼저 다음 명령을 사용하여 데이터를 로드합니다.

시스템 자동 사용

그런 다음 다음 명령을 사용하여 원시 데이터를 표시합니다.

br

Stata의 자동 데이터 세트

2단계: 다중 선형 회귀를 수행합니다.

다음으로, 가격을 응답 변수로, mpg무게를 설명 변수로 사용하여 다중 선형 회귀를 수행하기 위해 다음 명령을 입력합니다.

회귀 가격 mpg 무게

Stata의 다중 회귀 출력

3단계: Breusch-Pagan 테스트를 수행합니다.

회귀 모델을 적용한 후에는 “이분산성 테스트”의 약어인 hettest 명령을 사용하여 Breusch-Pagan 테스트를 수행할 수 있습니다.

가장 뜨거운

Stata의 Breusch-Pagan 테스트 결과

결과를 해석하는 방법은 다음과 같습니다.

Ho: 이것은 잔차 사이에 일정한 분산이 존재한다는 검정의 귀무가설입니다.

변수: 회귀 모델에 사용된 응답 변수를 알려줍니다. 이 경우에는 가변 가격 이었습니다.

chi2(1): 검정의 카이제곱 검정 통계량입니다. 이 경우 오후 2시 78분입니다.

Prob > chi2: 카이제곱 검정 통계량에 해당하는 p-값입니다. 이 경우에는 0.0001입니다. 이 값이 0.05보다 작으면 귀무가설을 기각하고 데이터에 이분산성이 있다는 결론을 내릴 수 있습니다.

다음에 무엇을할지

Breusch-Pagan 검정의 귀무 가설을 기각하지 못하면 이분산성이 존재하지 않으며 원래 회귀 분석의 결과를 해석할 수 있습니다.

그러나 Breusch-Pagan 검정의 귀무가설을 기각하면 데이터에 이분산성이 존재한다는 의미입니다. 이 경우 회귀 출력 테이블에 표시되는 표준 오류는 신뢰할 수 없습니다. 이 문제를 해결하는 방법에는 다음을 포함하여 여러 가지가 있습니다.

1. 반응 변수를 변환합니다. 반응 변수에 대한 변환을 시도할 수 있습니다. 예를 들어, 가격 대신 log(가격)을 응답 변수로 사용할 수 있습니다. 일반적으로 반응 변수의 로그를 취하는 것은 이분산성을 제거하는 효과적인 방법입니다. 또 다른 일반적인 변환은 반응 변수의 제곱근을 사용하는 것입니다.

2. 가중 회귀를 사용하십시오. 이 유형의 회귀는 적합치의 분산을 기반으로 각 데이터 포인트에 가중치를 할당합니다. 본질적으로 이는 분산이 더 높은 데이터 포인트에 낮은 가중치를 부여하여 잔차 제곱을 줄입니다. 적절한 가중치를 사용하면 이분산성 문제를 해결할 수 있습니다.

3. 강력한 표준 오류를 사용하십시오. 강인 표준 오차는 이분산성 문제에 대해 더욱 “강건”하며 회귀 계수의 실제 표준 오차에 대한 보다 정확한 측정값을 제공하는 경향이 있습니다. Stata의 회귀 분석에서 강력한 표준 오류를 사용하는 방법을 알아보려면 이 튜토리얼을 확인하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다