Как выполнить тест бреуша-пэгана в r


Тест Бреуша-Пэгана используется для определения наличия гетероскедастичности в регрессионном анализе.

В этом руководстве объясняется, как выполнить тест Бреуша-Пэгана в R.

Пример: тест Бреуша-Пэгана в R

В этом примере мы подберем регрессионную модель, используя встроенный набор данных R mtcars , а затем выполним тест Бреуша-Пэгана, используя функцию bptest из библиотеки lmtest , чтобы определить наличие гетероскедастичности.

Шаг 1. Подберите регрессионную модель.

Во-первых, мы подберем регрессионную модель, используя миль на галлон в качестве переменной отклика и disp и hp в качестве двух объясняющих переменных.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Шаг 2: Проведите тест Бреуша-Пэгана.

Далее мы проведем тест Бреуша-Пэгана, чтобы определить, присутствует ли гетероскедастичность.

 #load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 4.0861, df = 2, p-value = 0.1296

Статистика теста равна 4,0861 , а соответствующее значение p — 0,1296 . Поскольку значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы утверждать, что гетероскедастичность присутствует в регрессионной модели.

Что делать дальше

Если вам не удастся отвергнуть нулевую гипотезу теста Бреуша-Пэгана, то гетероскедастичности нет и вы можете приступить к интерпретации результата исходной регрессии.

Однако если вы отклоните нулевую гипотезу, это означает, что в данных присутствует гетероскедастичность. В этом случае стандартные ошибки, отображаемые в выходной таблице регрессии, могут быть недостоверными.

Существует несколько распространенных способов решения этой проблемы, в том числе:

1. Преобразуйте переменную ответа. Вы можете попытаться выполнить преобразование переменной ответа. Например, вы можете использовать переменную ответа журнала вместо исходной переменной ответа. Как правило, логарифм переменной отклика является эффективным способом устранения гетероскедастичности. Другое распространенное преобразование — использование квадратного корня из переменной ответа.

2. Используйте взвешенную регрессию. Этот тип регрессии присваивает вес каждой точке данных на основе дисперсии ее подобранного значения. По сути, это придает низкий вес точкам данных с более высокими дисперсиями, уменьшая их остаточные квадраты. Использование соответствующих весов позволяет устранить проблему гетероскедастичности.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *