Розуміння нульової гіпотези для лінійної регресії


Лінійна регресія – це техніка, яку ми можемо використати, щоб зрозуміти взаємозв’язок між однією або декількома змінними предиктора та змінною відповіді .

Якщо у нас є лише одна змінна предиктор і одна змінна відповіді, ми можемо використати просту лінійну регресію , яка використовує таку формулу для оцінки зв’язку між змінними:

ŷ = β 0 + β 1 x

золото:

  • ŷ: очікуване значення відповіді.
  • β 0 : середнє значення y, коли x дорівнює нулю.
  • β 1 : середня зміна y, пов’язана зі збільшенням x на одну одиницю.
  • x: значення передбачуваної змінної.

Проста лінійна регресія використовує такі нульові та альтернативні гіпотези:

  • H 0 : β 1 = 0
  • H A : β 1 ≠ 0

Нульова гіпотеза стверджує, що коефіцієнт β 1 дорівнює нулю. Іншими словами, немає статистично значущого зв’язку між змінною предиктора x і змінною відповіді y.

Альтернативна гіпотеза стверджує, що β 1 не дорівнює нулю. Іншими словами, між x і y існує статистично значущий зв’язок.

Якщо у нас є кілька змінних предикторів і змінна відповіді, ми можемо використати множинну лінійну регресію , яка використовує таку формулу для оцінки зв’язку між змінними:

ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k

золото:

  • ŷ: очікуване значення відповіді.
  • β 0 : середнє значення y, коли всі змінні предиктора дорівнюють нулю.
  • β i : Середня зміна y, пов’язана зі збільшенням x i на одну одиницю.
  • x i : значення змінної предиктора x i .

Множинна лінійна регресія використовує такі нульові та альтернативні гіпотези:

  • H 0 : β 1 = β 2 = … = β k = 0
  • H A : β 1 = β 2 = … = β k ≠ 0

Нульова гіпотеза стверджує, що всі коефіцієнти в моделі дорівнюють нулю. Іншими словами, жодна з прогностичних змінних не має статистично значущого зв’язку зі змінною відповіді y.

Альтернативна гіпотеза стверджує, що не всі коефіцієнти одночасно дорівнюють нулю.

У наведених нижче прикладах показано, як вирішити, чи відхиляти нульову гіпотезу в моделях простої лінійної регресії та множинної лінійної регресії.

Приклад 1: Проста лінійна регресія

Припустимо, професор хоче використати кількість вивчених годин, щоб передбачити оцінку на іспиті, яку отримають студенти його класу. Він збирає дані від 20 студентів і відповідає простій моделі лінійної регресії.

На наступному знімку екрана показано результат регресійної моделі:

Простий вихід лінійної регресії в Excel

Підігнана проста модель лінійної регресії:

Оцінка за іспит = 67,1617 + 5,2503*(вивчені години)

Щоб визначити, чи існує статистично значущий зв’язок між годинами навчання та результатом іспиту, нам потрібно проаналізувати загальне F-значення моделі та відповідне p-значення:

  • Загальне F-значення: 47,9952
  • Р-значення: 0,000

Оскільки це p-значення менше 0,05, ми можемо відхилити нульову гіпотезу. Іншими словами, існує статистично значущий зв’язок між годинами навчання та результатами іспиту.

Приклад 2: Множинна лінійна регресія

Припустімо, що професор хоче використовувати кількість вивчених годин і кількість складених підготовчих іспитів, щоб передбачити оцінку, яку отримають студенти в його класі. Він збирає дані від 20 студентів і відповідає моделі множинної лінійної регресії.

На наступному знімку екрана показано результат регресійної моделі:

Вихід множинної лінійної регресії в Excel

Підігнана модель множинної лінійної регресії:

Бал іспиту = 67,67 + 5,56*(вивчені години) – 0,60*(здані підготовчі іспити)

Щоб визначити, чи існує статистично значущий зв’язок між двома змінними предиктора та змінною відповіді, нам потрібно проаналізувати загальне значення F моделі та відповідне значення p:

  • Загальне F-значення: 23,46
  • Р-значення: 0,00

Оскільки це p-значення менше 0,05, ми можемо відхилити нульову гіпотезу. Іншими словами, кількість вивчених годин і складених підготовчих іспитів мають статистично значущий зв’язок із результатами іспитів.

Примітка. Незважаючи на те, що значення p для складених підготовчих іспитів (p = 0,52) не є значущим, підготовчі іспити в поєднанні з навчальними годинами мають значний зв’язок з результатами іспитів.

Додаткові ресурси

Розуміння тесту F для загальної значущості в регресії
Як читати та інтерпретувати таблицю регресії
Як повідомити про результати регресії
Як виконати просту лінійну регресію в Excel
Як виконати множинну лінійну регресію в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *