Як виконати тест брейша-пейгана в r
Критерій Брейша-Пейгана використовується для визначення наявності гетероскедастичності в регресійному аналізі.
Цей підручник пояснює, як виконати тест Брейша-Пейгана в R.
Приклад: тест Брейша-Пагана в Р
У цьому прикладі ми підберемо регресійну модель за допомогою вбудованого набору даних R mtcars , а потім виконаємо тест Брейша-Пагана за допомогою функції bptest із бібліотеки lmtest , щоб визначити, чи присутня гетероскедастичність.
Крок 1. Підберіть регресійну модель.
По-перше, ми підберемо регресійну модель, використовуючи mpg як змінну відповіді та disp і hp як дві пояснювальні змінні.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Крок 2: Виконайте тест Брейша-Пейгана.
Далі ми виконаємо тест Брейша-Пейгана, щоб визначити наявність гетероскедастичності.
#load lmtest library library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 4.0861, df = 2, p-value = 0.1296
Статистика тесту становить 4,0861 , а відповідне значення p — 0,1296 . Оскільки p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. У нас немає достатніх доказів, щоб стверджувати, що гетероскедастичність присутня в регресійній моделі.
Що робити далі
Якщо вам не вдалося відхилити нульову гіпотезу тесту Брейша-Пейгана, то гетероскедастичність відсутня, і ви можете продовжити інтерпретацію результату вихідної регресії.
Однак якщо ви відкидаєте нульову гіпотезу, це означає, що гетероскедастичність присутня в даних. У цьому випадку стандартні помилки, відображені в таблиці результатів регресії, можуть бути ненадійними.
Існує кілька поширених способів вирішення цієї проблеми, зокрема:
1. Перетворення змінної відповіді. Ви можете спробувати виконати перетворення змінної відповіді. Наприклад, ви можете використовувати змінну відповіді журналу замість початкової змінної відповіді. Загалом, реєстрація змінної відповіді є ефективним способом усунення гетероскедастичності. Іншим поширеним перетворенням є використання квадратного кореня зі змінної відповіді.
2. Використовуйте зважену регресію. Цей тип регресії призначає вагу кожній точці даних на основі дисперсії її підігнаного значення. По суті, це дає низькі ваги для точок даних, які мають більшу дисперсію, зменшуючи їхні залишкові квадрати. Якщо використовуються відповідні ваги, це може усунути проблему гетероскедастичності.