Как выполнить тест бреуша-пэгана в r

К бенджамин андерсон 29 июля, 2023 Гид 0 комментариев

Тест Бреуша-Пэгана используется для определения наличия гетероскедастичности в регрессионном анализе.

В этом руководстве объясняется, как выполнить тест Бреуша-Пэгана в R.

Пример: тест Бреуша-Пэгана в R

В этом примере мы подберем регрессионную модель, используя встроенный набор данных R mtcars , а затем выполним тест Бреуша-Пэгана, используя функцию bptest из библиотеки lmtest , чтобы определить наличие гетероскедастичности.

Шаг 1. Подберите регрессионную модель.

Во-первых, мы подберем регрессионную модель, используя миль на галлон в качестве переменной отклика и disp и hp в качестве двух объясняющих переменных.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Шаг 2: Проведите тест Бреуша-Пэгана.

Далее мы проведем тест Бреуша-Пэгана, чтобы определить, присутствует ли гетероскедастичность.

 #load lmtest library
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 4.0861, df = 2, p-value = 0.1296

Статистика теста равна 4,0861 , а соответствующее значение p — 0,1296 . Поскольку значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы утверждать, что гетероскедастичность присутствует в регрессионной модели.

Что делать дальше

Если вам не удастся отвергнуть нулевую гипотезу теста Бреуша-Пэгана, то гетероскедастичности нет и вы можете приступить к интерпретации результата исходной регрессии.

Однако если вы отклоните нулевую гипотезу, это означает, что в данных присутствует гетероскедастичность. В этом случае стандартные ошибки, отображаемые в выходной таблице регрессии, могут быть недостоверными.

Существует несколько распространенных способов решения этой проблемы, в том числе:

1. Преобразуйте переменную ответа. Вы можете попытаться выполнить преобразование переменной ответа. Например, вы можете использовать переменную ответа журнала вместо исходной переменной ответа. Как правило, логарифм переменной отклика является эффективным способом устранения гетероскедастичности. Другое распространенное преобразование — использование квадратного корня из переменной ответа.

2. Используйте взвешенную регрессию. Этот тип регрессии присваивает вес каждой точке данных на основе дисперсии ее подобранного значения. По сути, это придает низкий вес точкам данных с более высокими дисперсиями, уменьшая их остаточные квадраты. Использование соответствующих весов позволяет устранить проблему гетероскедастичности.

Об авторе

бенджамин андерсон

Здравствуйте, я Бенджамин, профессор статистики на пенсии, ставший преданным преподавателем Statorials. Имея обширный опыт и знания в области статистики, я хочу поделиться своими знаниями, чтобы расширить возможности студентов с помощью Statorials. Узнать больше

Пример: тест Бреуша-Пэгана в R

Что делать дальше

Об авторе

бенджамин андерсон

Добавить комментарий