Jak wykonać test breuscha-pagana w sas


Test Breuscha-Pagana służy do określenia, czy w analizie regresji występuje heteroskedastyczność .

W tym samouczku wyjaśniono, jak wykonać test Breuscha-Pagana w SAS-ie.

Przykład: test Breuscha-Pagana w SAS

Załóżmy, że chcemy dopasować model regresji liniowej wielokrotnej, który wykorzystuje liczbę godzin spędzonych na nauce i liczbę zdanych egzaminów praktycznych, aby przewidzieć końcową ocenę uczniów z egzaminu:

Wynik egzaminu = β 0 + β 1 (godziny) + β 2 (egzaminy przygotowawcze)

Najpierw użyjemy następującego kodu, aby utworzyć zbiór danych zawierający te informacje dla 20 uczniów:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

Następnie użyjemy modelu proc, aby dopasować ten model regresji liniowej, a także instrukcji pogańskiej , aby wykonać test Breuscha-Pagana na heteroskedastyczność:

 /*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
    parms a1 b1 b2;
    score = a1 + b1*hours + b2*prep_exams;
    fit score / pagan=(1 hours prep_exams)
    out =resid1 outsid ;
run ;
quit ; 

Test Breuscha-Pagana w SAS

Ostatnia tabela wyników przedstawia wyniki testu Breuscha-Pagana.

Z tej tabeli widzimy, że statystyka testowa wynosi 5,05 , a odpowiadająca jej wartość p wynosi 0,0803 .

Ponieważ wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej.

Oznacza to, że nie mamy wystarczających dowodów, aby twierdzić, że w modelu regresji występuje heteroskedastyczność.

Można zatem bezpiecznie interpretować błędy standardowe oszacowań współczynników w tabeli podsumowującej regresję.

Co zrobic nastepnie

Jeśli nie odrzucisz hipotezy zerowej testu Breuscha-Pagana, wówczas heteroskedastyczność nie występuje i możesz przystąpić do interpretacji wyniku pierwotnej regresji.

Jeśli jednak odrzucisz hipotezę zerową, oznacza to, że w danych występuje heteroskedastyczność. W takim przypadku błędy standardowe wyświetlane w tabeli wyników regresji mogą być niewiarygodne.

Istnieje kilka typowych sposobów rozwiązania tego problemu, w tym:

1. Przekształć zmienną odpowiedzi. Możesz spróbować przeprowadzić transformację zmiennej odpowiedzi.

Można na przykład użyć zmiennej odpowiedzi dziennika zamiast oryginalnej zmiennej odpowiedzi.

Ogólnie rzecz biorąc , skutecznym sposobem na usunięcie heteroskedastyczności jest użycie logu zmiennej odpowiedzi.

Inną powszechną transformacją jest użycie pierwiastka kwadratowego ze zmiennej odpowiedzi.

2. Zastosuj regresję ważoną. Ten typ regresji przypisuje wagę każdemu punktowi danych na podstawie wariancji jego dopasowanej wartości.

Daje to małe wagi punktom danych o większych wariancjach, redukując ich kwadraty resztowe.

Zastosowanie odpowiednich wag może wyeliminować problem heteroskedastyczności.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *