Jak wykonać test breuscha-pagana w r


Test Breuscha-Pagana służy do określenia, czy w analizie regresji występuje heteroskedastyczność .

W tym samouczku wyjaśniono, jak wykonać test Breuscha-Pagana w języku R.

Przykład: test Breuscha-Pagana w R

W tym przykładzie dopasujemy model regresji, korzystając z wbudowanego zbioru danych R mtcars , a następnie przeprowadzimy test Breuscha-Pagana, korzystając z funkcji bptest z biblioteki lmtest , aby określić, czy występuje heteroskedastyczność.

Krok 1: Dopasuj model regresji.

Najpierw dopasujemy model regresji, wykorzystując mpg jako zmienną odpowiedzi oraz disp i hp jako dwie zmienne objaśniające.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Krok 2: Wykonaj test Breuscha-Pagana.

Następnie przeprowadzimy test Breuscha-Pagana, aby określić, czy występuje heteroskedastyczność.

 #load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 4.0861, df = 2, p-value = 0.1296

Statystyka testowa wynosi 4,0861 , a odpowiadająca jej wartość p wynosi 0,1296 . Ponieważ wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Nie mamy wystarczających dowodów, aby twierdzić, że w modelu regresji występuje heteroskedastyczność.

Co zrobic nastepnie

Jeśli nie odrzucisz hipotezy zerowej testu Breuscha-Pagana, wówczas heteroskedastyczność nie występuje i możesz przystąpić do interpretacji wyniku pierwotnej regresji.

Jeśli jednak odrzucisz hipotezę zerową, oznacza to, że w danych występuje heteroskedastyczność. W takim przypadku błędy standardowe wyświetlane w tabeli wyników regresji mogą być niewiarygodne.

Istnieje kilka typowych sposobów rozwiązania tego problemu, w tym:

1. Przekształć zmienną odpowiedzi. Możesz spróbować przeprowadzić transformację zmiennej odpowiedzi. Można na przykład użyć zmiennej odpowiedzi dziennika zamiast oryginalnej zmiennej odpowiedzi. Ogólnie rzecz biorąc, skutecznym sposobem na wyeliminowanie heteroskedastyczności jest zarejestrowanie zmiennej odpowiedzi. Inną powszechną transformacją jest użycie pierwiastka kwadratowego ze zmiennej odpowiedzi.

2. Zastosuj regresję ważoną. Ten typ regresji przypisuje wagę każdemu punktowi danych na podstawie wariancji jego dopasowanej wartości. Zasadniczo nadaje to niskie wagi punktom danych o większych wariancjach, zmniejszając ich kwadraty resztowe. Zastosowanie odpowiednich wag może wyeliminować problem heteroskedastyczności.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *