Jak wykonać test breuscha-pagana w stata
Wielokrotna regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między wieloma zmiennymi objaśniającymi a zmienną odpowiedzi.
Niestety, problem często występujący w regresji jest znany jako heteroskedastyczność , w której występuje systematyczna zmiana wariancji reszt w pewnym zakresie mierzonych wartości.
Jednym z testów, za pomocą którego możemy określić, czy występuje heteroskedastyczność, jest test Breuscha-Pagana . Test ten generuje statystykę testu Chi-kwadrat i odpowiadającą jej wartość p.
Jeśli wartość p jest poniżej pewnego progu (najczęściej wybierane wartości to 0,01, 0,05 i 0,10), wówczas istnieją wystarczające dowody, aby stwierdzić, że występuje heteroskedastyczność.
W tym samouczku wyjaśniono, jak wykonać test Breuscha-Pagana w Stata.
Przykład: test Breuscha-Pagana w Stata
Wykorzystamy automatycznie zintegrowany zbiór danych Stata, aby zilustrować sposób przeprowadzenia testu Breuscha-Pagana.
Krok 1: Załaduj i wyświetl dane.
Najpierw użyj następującego polecenia, aby załadować dane:
automatyczne korzystanie z systemu
Następnie wyświetl surowe dane za pomocą następującego polecenia:
br
Krok 2: Wykonaj wielokrotną regresję liniową.
Następnie wprowadzimy następujące polecenie, aby wykonać wielokrotną regresję liniową, używając ceny jako zmiennej odpowiedzi oraz mpg i wagi jako zmiennych objaśniających:
regresja cena mpg waga
Krok 3: Wykonaj test Breuscha-Pagana.
Po dopasowaniu modelu regresji możemy wykonać test Breuscha-Pagana za pomocą polecenia hettest , które jest skrótem od „test heteroskedastyczności”:
najgorętszy
Oto jak zinterpretować wynik:
Ho: To jest hipoteza zerowa testu, która stwierdza, że istnieje stała wariancja pomiędzy resztami.
Zmienne: informuje nas o zmiennej odpowiedzi użytej w modelu regresji. W tym przypadku była to cena zmienna.
chi2(1): Jest to statystyka testu chi-kwadrat. W tym przypadku jest to 14:78.
Prob > chi2: Jest to wartość p odpowiadająca statystyce testu chi-kwadrat. W tym przypadku jest to 0,0001. Ponieważ wartość ta jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową i stwierdzić, że dane wykazują heteroskedastyczność.
Co zrobic nastepnie
Jeśli nie odrzucisz hipotezy zerowej testu Breuscha-Pagana, heteroskedastyczność nie występuje i możesz przystąpić do interpretacji wyniku pierwotnej regresji.
Jeśli jednak odrzucisz hipotezę zerową testu Breuscha-Pagana, oznacza to, że w danych występuje heteroskedastyczność. W tym przypadku błędy standardowe wyświetlane w tabeli wyników regresji są niewiarygodne. Istnieje kilka sposobów rozwiązania tego problemu, w tym:
1. Przekształć zmienną odpowiedzi. Możesz spróbować przeprowadzić transformację zmiennej odpowiedzi. Na przykład możesz użyć log(cena) zamiast ceny jako zmiennej odpowiedzi. Ogólnie rzecz biorąc, skutecznym sposobem na wyeliminowanie heteroskedastyczności jest zarejestrowanie zmiennej odpowiedzi. Inną powszechną transformacją jest użycie pierwiastka kwadratowego ze zmiennej odpowiedzi.
2. Zastosuj regresję ważoną. Ten typ regresji przypisuje wagę każdemu punktowi danych na podstawie wariancji jego dopasowanej wartości. Zasadniczo nadaje to niskie wagi punktom danych o większych wariancjach, zmniejszając ich kwadraty resztowe. Zastosowanie odpowiednich wag może wyeliminować problem heteroskedastyczności.
3. Używaj solidnych błędów standardowych. Odporne błędy standardowe są bardziej „odporne” na problem heteroskedastyczności i zwykle zapewniają dokładniejszą miarę prawdziwego błędu standardowego współczynnika regresji. Sprawdź ten samouczek, aby dowiedzieć się, jak używać solidnych błędów standardowych w regresji w Stata.