Test breuscha-pagana: definicja i przykład


Jednym z kluczowych założeń regresji liniowej jest to, że reszty mają rozkład z równą wariancją na każdym poziomie zmiennej predykcyjnej. Założenie to znane jest jako homoskedastyczność .

Jeżeli to założenie nie jest przestrzegane, mówi się, że w resztach występuje heteroskedastyczność . Kiedy tak się dzieje, wyniki regresji stają się niewiarygodne.

Jednym ze sposobów wizualnego wykrycia obecności heteroskedastyczności jest utworzenie wykresu reszt względem dopasowanych wartości z modelu regresji.

Jeśli reszty rozkładają się bardziej przy wyższych wartościach na wykresie, jest to charakterystyczny znak obecności heteroskedastyczności.

Przykład heteroskedastyczności dla testu Breuscha-Pagana

Formalnym testem statystycznym, którego możemy użyć do określenia, czy występuje heteroskedastyczność, jest test Breuscha-Pagana .

Ten samouczek zawiera krótkie wyjaśnienie testu Breuscha-Pagana wraz z przykładem.

Co to jest test Breuscha-Pagana?

Test Breuscha-Pagana służy do określenia, czy w modelu regresji występuje heteroskedastyczność.

W teście wykorzystuje się następujące hipotezy zerowe i alternatywne:

  • Hipoteza zerowa (H 0 ): występuje homoskedastyczność (reszty rozkładają się z równą wariancją)
  • Hipoteza alternatywna ( HA ): występuje heteroskedastyczność (reszty nie są rozłożone z równą wariancją)

Jeśli wartość p testu jest poniżej pewnego poziomu istotności (tj. α = 0,05), wówczas odrzucamy hipotezę zerową i stwierdzamy, że w modelu regresji występuje heteroskedastyczność.

Aby wykonać test Breuscha-Pagana, stosujemy następujące kroki:

1. Dopasuj model regresji.

2. Oblicz kwadraty reszt modelu.

3. Dopasuj nowy model regresji, używając kwadratów reszt jako wartości odpowiedzi.

4. Oblicz statystykę testową Chi-kwadrat X 2 w postaci n*R 2 new gdzie:

  • n: Całkowita liczba obserwacji
  • R 2 nowość : R kwadrat nowego modelu regresji, w którym jako wartości odpowiedzi wykorzystano kwadraty reszt

Jeśli wartość p odpowiadająca tej statystyce testu chi-kwadrat z p (liczbą predyktorów) stopni swobody jest poniżej pewnego poziomu istotności (tj. α = 0,05), wówczas odrzuć hipotezę zerową i wyciągnij wniosek, że występuje heteroskedastyczność .

W przeciwnym razie nie odrzucaj hipotezy zerowej. W tym przypadku zakłada się, że występuje homoskedastyczność.

Należy pamiętać, że większość programów statystycznych może z łatwością przeprowadzić test Breuscha-Pagana, więc prawdopodobnie nigdy nie będziesz musiał wykonywać tych kroków ręcznie, ale warto wiedzieć, co dzieje się za kulisami.

Przykład testu Breuscha-Pagana

Załóżmy, że mamy następujący zbiór danych zawierający informacje o 10 różnych koszykarzach:

Korzystając z oprogramowania statystycznego, dopasowujemy następujący model regresji liniowej wielokrotnej :

wynik = 62,47 + 1,12*(punkty) + 0,88*(asysty) – 0,43*(zbiórki)

Następnie używamy tego modelu, aby przewidzieć ocenę każdego gracza i obliczyć kwadraty reszt (tj. kwadratową różnicę między przewidywaną oceną a rzeczywistą oceną):

Następnie dopasowujemy nowy model regresji, wykorzystując kwadraty reszt jako wartości odpowiedzi i ponownie pierwotne zmienne predykcyjne jako zmienne predykcyjne. Znajdujemy następujące informacje:

  • n: 10
  • R2 nowy : 0,600395

Zatem nasza statystyka testu Chi-kwadrat dla testu Breuscha-Pagana wynosi n*R 2 nowy = 10*.600395 = 6,00395 . Stopnie swobody to p = 3 zmienne predykcyjne.

Według kalkulatora wartości chi-kwadrat P , wartość p odpowiadająca X2 = 6,00395 z 3 stopniami swobody wynosi 0,111418 .

Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Zakładamy zatem, że homoskedastyczność jest obecna.

Test Breuscha-Pagana w praktyce

Poniższe tutoriale zawierają przykłady krok po kroku wykonywania testu Breuscha-Pagana w różnych programach statystycznych:

Jak wykonać test Breuscha-Pagana w programie Excel
Jak wykonać test Breuscha-Pagana w R
Jak wykonać test Breuscha-Pagana w Pythonie
Jak wykonać test Breuscha-Pagana w Stata

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *