Як інтерпретувати відрізок у регресійній моделі: із прикладами
Відрізок (іноді його називають «константою») у регресійній моделі представляє середнє значення змінної відповіді, коли всі змінні предикторів у моделі дорівнюють нулю.
У цьому підручнику пояснюється, як інтерпретувати початкове значення в моделях простої лінійної регресії та лінійної регресії.
Інтерпретація перетину в простій лінійній регресії
Проста модель лінійної регресії має такий вигляд:
ŷ = β 0 + β 1 (x)
золото:
- ŷ: прогнозоване значення для змінної відповіді
- β 0 : Середнє значення змінної відповіді, коли x = 0
- β 1 : Середня зміна змінної відповіді для збільшення x на одну одиницю
- x: значення передбачуваної змінної
У деяких випадках має сенс інтерпретувати значення перехоплення в моделі простої лінійної регресії, але не завжди. Наведені нижче приклади ілюструють це.
Приклад 1: Перехоплення має сенс інтерпретувати
Припустімо, що ми хочемо підібрати просту модель лінійної регресії, використовуючи вивчені години як змінну-прогностику та оцінки за іспит як змінну відповіді.
Ми збираємо ці дані для 50 студентів певного університетського курсу та відповідаємо такій регресійній моделі:
Бал іспиту = 65,4 + 2,67 (год.)
Значення вихідного члена в цій моделі становить 65,4 . Це означає, що середній бал іспиту становить 65,4 , коли кількість вивчених годин дорівнює нулю.
Це має сенс інтерпретувати, оскільки цілком імовірно, що студент навчатиметься нуль годин для іспиту.
Приклад 2: Перехоплення не має сенсу тлумачити
Припустімо, ми хочемо підібрати просту лінійну регресійну модель, використовуючи вагу (у фунтах) як змінну прогностику та зріст (у дюймах) як змінну відповіді.
Ми збираємо ці дані для 50 осіб і застосовуємо таку модель регресії:
Зріст = 22,3 + 0,28 (фунтів)
Значення вихідного члена в цій моделі становить 22,3 . Це означало б, що середній зріст людини становить 22,3 дюйма, коли його вага дорівнює нулю.
Це не має сенсу тлумачити, оскільки людина не може важити нуль фунтів.
Однак нам все одно потрібно зберегти вихідний термін у моделі, щоб ми могли використовувати модель для прогнозування. Перехоплення просто не має значущої інтерпретації для цієї моделі.
Інтерпретація перетину в множинній лінійній регресії
Модель множинної лінійної регресії має такий вигляд:
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
золото:
- ŷ: прогнозоване значення для змінної відповіді
- β 0 : Середнє значення змінної відповіді, коли всі змінні предиктора дорівнюють нулю
- β j : середня зміна змінної відповіді для збільшення j- ї змінної предиктора на одну одиницю, припускаючи, що всі інші змінні предиктора залишаються постійними.
- x j : значення j -ї прогностичної змінної
Подібно до простої лінійної регресії, іноді має сенс інтерпретувати значення перехоплення в моделі множинної лінійної регресії, але не завжди. Наведені нижче приклади ілюструють це.
Приклад 1: Перехоплення має сенс інтерпретувати
Припустімо, що ми хочемо підібрати модель множинної лінійної регресії, використовуючи навчальні години та підготовчі іспити, взяті як змінні прогностики, і оцінки іспитів як змінну відповіді.
Ми збираємо ці дані для 50 студентів певного університетського курсу та відповідаємо такій регресійній моделі:
Екзаменаційний бал = 58,4 + 2,23 (години) + 1,34 (кількість підготовчих іспитів)
Значення вихідного члена в цій моделі становить 58,4 . Це означає, що середній іспитовий бал становить 58,4 , коли кількість вивчених годин і кількість складених підготовчих іспитів дорівнюють нулю.
Це має сенс інтерпретувати, оскільки цілком імовірно, що студент навчатиметься нуль годин і не здаватиме підготовчих іспитів перед самим іспитом.
Приклад 2: Перехоплення не має сенсу тлумачити
Припустімо, ми хочемо підібрати модель множинної лінійної регресії, використовуючи квадратні метри та кількість спалень як прогностичні змінні та ціну продажу як змінну відповіді.
Ми збираємо ці дані для 100 будинків у певному місті та застосовуємо таку модель регресії:
Ціна = 87 244 + 3,44 (квадратних футів) + 843,45 (кількість спалень)
Значення вихідного члена в цій моделі становить 87,244 . Це означало б, що середня ціна продажу будинку становить 87 244 долари , якщо площа будинку та кількість спалень дорівнюють нулю.
Це не має сенсу тлумачити, оскільки неможливо, щоб у будинку було нуль квадратних метрів і нуль спалень.
Однак нам все одно потрібно зберегти вихідний термін у моделі, щоб використовувати його для прогнозування. Перехоплення просто не має значущої інтерпретації для цієї моделі.
Додаткові ресурси
Вступ до простої лінійної регресії
Вступ до множинної лінійної регресії
Як інтерпретувати часткові коефіцієнти регресії