Тест брейша-пейгана: визначення та приклад


Одне з ключових припущень лінійної регресії полягає в тому, що залишки розподіляються з рівною дисперсією на кожному рівні змінної предиктора. Це припущення відоме як гомоскедастичність .

Якщо це припущення не виконується, кажуть, що гетероскедастичність присутня в залишках. Коли це відбувається, результати регресії стають ненадійними.

Один із способів візуально визначити наявність гетероскедастичності — це створити графік залишків проти підігнаних значень із моделі регресії.

Якщо залишки розповсюджуються більше при більш високих значеннях на графіку, це свідчить про наявність гетероскедастичності.

Приклад гетероскедастичності для тесту Брейша-Пейгана

Формальним статистичним тестом, який ми можемо використовувати для визначення наявності гетероскедастичності, є тест Брейша-Пейгана .

Цей підручник містить коротке пояснення тесту Брейша-Пейгана разом із прикладом.

Що таке тест Брейша-Пагана?

Критерій Брейша-Пейгана використовується для визначення наявності гетероскедастичності в регресійній моделі.

Тест використовує такі нульові та альтернативні гіпотези :

  • Нульова гіпотеза (H 0 ): наявна гомоскедастичність (залишки розподіляються з рівною дисперсією)
  • Альтернативна гіпотеза ( HA ): наявна гетероскедастичність (залишки не розподілені з рівною дисперсією)

Якщо p-значення тесту нижче певного рівня значущості (тобто α = 0,05), тоді ми відхиляємо нульову гіпотезу та робимо висновок, що гетероскедастичність присутня в регресійній моделі.

Ми використовуємо наступні кроки для виконання тесту Брейша-Пейгана:

1. Підібрати регресійну модель.

2. Обчислити квадрати модельних нев’язок.

3. Підберіть нову модель регресії, використовуючи квадрати залишків як значення відповіді.

4. Обчисліть тестову статистику хі-квадрат X 2 у формі n*R 2 new , де:

  • n: Загальна кількість спостережень
  • R 2 new : R у квадраті нової регресійної моделі, яка використовувала квадрати залишків як значення відповіді

Якщо значення p, яке відповідає цій статистиці тесту хі-квадрат із p (кількістю предикторів) ступенів свободи, нижче певного рівня значущості (тобто α = 0,05), тоді відхиліть нульову гіпотезу та зробіть висновок про наявність гетероскедастичності. .

В іншому випадку не відкидайте нульову гіпотезу. У цьому випадку передбачається наявність гомоскедастичності.

Зауважте, що більшість статистичних програм може легко виконати тест Брейша-Пейгана, тож вам, ймовірно, ніколи не доведеться виконувати ці дії вручну, але корисно знати, що відбувається за лаштунками.

Приклад тесту Брейша-Пагана

Припустимо, що ми маємо наступний набір даних, що містить інформацію про 10 різних баскетболістів:

Використовуючи статистичне програмне забезпечення, ми підібрали наступну модель множинної лінійної регресії :

рахунок = 62,47 + 1,12*(очки) + 0,88*(ассисти) – 0,43*(підбирання)

Потім ми використовуємо цю модель, щоб зробити прогнози щодо рейтингу кожного гравця та обчислити квадрати залишків (тобто квадрат різниці між прогнозованим рейтингом і фактичним рейтингом):

Далі ми підбираємо нову регресійну модель, використовуючи квадрати залишків як значення відповіді та вихідні змінні предиктора як змінні предиктора. Ми знайшли наступне:

  • n: 10
  • R 2 новий : 0,600395

Отже, наша статистика хі-квадрат для тесту Брейша-Пейгана становить n*R 2 new = 10*.600395 = 6.00395 . Ступені свободи є p = 3 змінними предикторів.

Відповідно до калькулятора хі-квадрат до значення P , значення p, яке відповідає X 2 = 6,00395 із 3 ступенями свободи, дорівнює 0,111418 .

Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Тому ми припускаємо, що гомоскедастичність присутня.

Проба Брейша-Пагана на практиці

Наступні навчальні посібники надають покрокові приклади виконання тесту Брейша-Пейгана в різних статистичних програмах:

Як виконати тест Брейша-Пагана в Excel
Як виконати тест Брейша-Пейгана в R
Як виконати тест Брейша-Пагана в Python
Як виконати тест Брейша-Пагана в Stata

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *