Jak wykonać test breuscha-pagana w r
Test Breuscha-Pagana służy do określenia, czy w analizie regresji występuje heteroskedastyczność .
W tym samouczku wyjaśniono, jak wykonać test Breuscha-Pagana w języku R.
Przykład: test Breuscha-Pagana w R
W tym przykładzie dopasujemy model regresji, korzystając z wbudowanego zbioru danych R mtcars , a następnie przeprowadzimy test Breuscha-Pagana, korzystając z funkcji bptest z biblioteki lmtest , aby określić, czy występuje heteroskedastyczność.
Krok 1: Dopasuj model regresji.
Najpierw dopasujemy model regresji, wykorzystując mpg jako zmienną odpowiedzi oraz disp i hp jako dwie zmienne objaśniające.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Krok 2: Wykonaj test Breuscha-Pagana.
Następnie przeprowadzimy test Breuscha-Pagana, aby określić, czy występuje heteroskedastyczność.
#load lmtest library library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 4.0861, df = 2, p-value = 0.1296
Statystyka testowa wynosi 4,0861 , a odpowiadająca jej wartość p wynosi 0,1296 . Ponieważ wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Nie mamy wystarczających dowodów, aby twierdzić, że w modelu regresji występuje heteroskedastyczność.
Co zrobic nastepnie
Jeśli nie odrzucisz hipotezy zerowej testu Breuscha-Pagana, wówczas heteroskedastyczność nie występuje i możesz przystąpić do interpretacji wyniku pierwotnej regresji.
Jeśli jednak odrzucisz hipotezę zerową, oznacza to, że w danych występuje heteroskedastyczność. W takim przypadku błędy standardowe wyświetlane w tabeli wyników regresji mogą być niewiarygodne.
Istnieje kilka typowych sposobów rozwiązania tego problemu, w tym:
1. Przekształć zmienną odpowiedzi. Możesz spróbować przeprowadzić transformację zmiennej odpowiedzi. Można na przykład użyć zmiennej odpowiedzi dziennika zamiast oryginalnej zmiennej odpowiedzi. Ogólnie rzecz biorąc, skutecznym sposobem na wyeliminowanie heteroskedastyczności jest zarejestrowanie zmiennej odpowiedzi. Inną powszechną transformacją jest użycie pierwiastka kwadratowego ze zmiennej odpowiedzi.
2. Zastosuj regresję ważoną. Ten typ regresji przypisuje wagę każdemu punktowi danych na podstawie wariancji jego dopasowanej wartości. Zasadniczo nadaje to niskie wagi punktom danych o większych wariancjach, zmniejszając ich kwadraty resztowe. Zastosowanie odpowiednich wag może wyeliminować problem heteroskedastyczności.