Розуміння нульової гіпотези для лінійної регресії
Лінійна регресія – це техніка, яку ми можемо використати, щоб зрозуміти взаємозв’язок між однією або декількома змінними предиктора та змінною відповіді .
Якщо у нас є лише одна змінна предиктор і одна змінна відповіді, ми можемо використати просту лінійну регресію , яка використовує таку формулу для оцінки зв’язку між змінними:
ŷ = β 0 + β 1 x
золото:
- ŷ: очікуване значення відповіді.
- β 0 : середнє значення y, коли x дорівнює нулю.
- β 1 : середня зміна y, пов’язана зі збільшенням x на одну одиницю.
- x: значення передбачуваної змінної.
Проста лінійна регресія використовує такі нульові та альтернативні гіпотези:
- H 0 : β 1 = 0
- H A : β 1 ≠ 0
Нульова гіпотеза стверджує, що коефіцієнт β 1 дорівнює нулю. Іншими словами, немає статистично значущого зв’язку між змінною предиктора x і змінною відповіді y.
Альтернативна гіпотеза стверджує, що β 1 не дорівнює нулю. Іншими словами, між x і y існує статистично значущий зв’язок.
Якщо у нас є кілька змінних предикторів і змінна відповіді, ми можемо використати множинну лінійну регресію , яка використовує таку формулу для оцінки зв’язку між змінними:
ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k
золото:
- ŷ: очікуване значення відповіді.
- β 0 : середнє значення y, коли всі змінні предиктора дорівнюють нулю.
- β i : Середня зміна y, пов’язана зі збільшенням x i на одну одиницю.
- x i : значення змінної предиктора x i .
Множинна лінійна регресія використовує такі нульові та альтернативні гіпотези:
- H 0 : β 1 = β 2 = … = β k = 0
- H A : β 1 = β 2 = … = β k ≠ 0
Нульова гіпотеза стверджує, що всі коефіцієнти в моделі дорівнюють нулю. Іншими словами, жодна з прогностичних змінних не має статистично значущого зв’язку зі змінною відповіді y.
Альтернативна гіпотеза стверджує, що не всі коефіцієнти одночасно дорівнюють нулю.
У наведених нижче прикладах показано, як вирішити, чи відхиляти нульову гіпотезу в моделях простої лінійної регресії та множинної лінійної регресії.
Приклад 1: Проста лінійна регресія
Припустимо, професор хоче використати кількість вивчених годин, щоб передбачити оцінку на іспиті, яку отримають студенти його класу. Він збирає дані від 20 студентів і відповідає простій моделі лінійної регресії.
На наступному знімку екрана показано результат регресійної моделі:

Підігнана проста модель лінійної регресії:
Оцінка за іспит = 67,1617 + 5,2503*(вивчені години)
Щоб визначити, чи існує статистично значущий зв’язок між годинами навчання та результатом іспиту, нам потрібно проаналізувати загальне F-значення моделі та відповідне p-значення:
- Загальне F-значення: 47,9952
- Р-значення: 0,000
Оскільки це p-значення менше 0,05, ми можемо відхилити нульову гіпотезу. Іншими словами, існує статистично значущий зв’язок між годинами навчання та результатами іспиту.
Приклад 2: Множинна лінійна регресія
Припустімо, що професор хоче використовувати кількість вивчених годин і кількість складених підготовчих іспитів, щоб передбачити оцінку, яку отримають студенти в його класі. Він збирає дані від 20 студентів і відповідає моделі множинної лінійної регресії.
На наступному знімку екрана показано результат регресійної моделі:

Підігнана модель множинної лінійної регресії:
Бал іспиту = 67,67 + 5,56*(вивчені години) – 0,60*(здані підготовчі іспити)
Щоб визначити, чи існує статистично значущий зв’язок між двома змінними предиктора та змінною відповіді, нам потрібно проаналізувати загальне значення F моделі та відповідне значення p:
- Загальне F-значення: 23,46
- Р-значення: 0,00
Оскільки це p-значення менше 0,05, ми можемо відхилити нульову гіпотезу. Іншими словами, кількість вивчених годин і складених підготовчих іспитів мають статистично значущий зв’язок із результатами іспитів.
Примітка. Незважаючи на те, що значення p для складених підготовчих іспитів (p = 0,52) не є значущим, підготовчі іспити в поєднанні з навчальними годинами мають значний зв’язок з результатами іспитів.
Додаткові ресурси
Розуміння тесту F для загальної значущості в регресії
Як читати та інтерпретувати таблицю регресії
Як повідомити про результати регресії
Як виконати просту лінійну регресію в Excel
Як виконати множинну лінійну регресію в Excel