Як інтерпретувати коефіцієнти логістичної регресії (з прикладом)
Логістична регресія – це метод, який ми можемо використати для підгонки моделі регресії, коли змінна відповіді є двійковою.
Коли ми підбираємо модель логістичної регресії, коефіцієнти результатів моделі представляють середню зміну логарифмічної ймовірності змінної відповіді, пов’язаної зі збільшенням на одну одиницю змінної-прогнозу.
β = Average Change in Log Odds of Response Variable
Ми часто хочемо зрозуміти середню зміну ймовірностей змінної відповіді, пов’язану зі збільшенням на одну одиницю змінної предиктора, яку ми можемо знайти за допомогою формули e β .
e β = Average Change in Odds of Response Variable
У наступному прикладі показано, як інтерпретувати коефіцієнти логістичної регресії на практиці.
Приклад: як інтерпретувати коефіцієнти логістичної регресії
Припустімо, що ми хочемо підібрати логістичну регресійну модель, використовуючи стать і кількість складених практичних іспитів, щоб передбачити, складе чи ні учень випускний іспит у класі.
Припустімо, ми підбираємо модель за допомогою статистичного програмного забезпечення (наприклад, R, Python , Excel або SAS ) і отримуємо такий результат:
Оцінка коеф | Стандартна помилка | Значення Z | Р-значення | |
---|---|---|---|---|
Перехоплення | -1,34 | 0,23 | 5.83 | <0,001 |
Чоловіча стать) | -0,56 | 0,25 | 2.24 | 0,03 |
Практичні іспити | 1.13 | 0,43 | 2.63 | 0,01 |
Як інтерпретувати стать (бінарна змінна предиктора)
Ми бачимо, що оцінка коефіцієнта для статі негативна, вказуючи на те, що бути чоловіком знижує шанси скласти іспит.
Ми також бачимо, що p-значення для статі менше 0,05, що означає, що воно має статистично значущий вплив на те, складе особа іспит чи ні.
Щоб точно зрозуміти, як те, чи людина складе іспит, впливає на те, чи вона буде чоловіком, ми можемо використати формулу e β .
е -0,56 = 0,57
Ми інтерпретуємо це так, що ймовірність скласти іспит у чоловіків лише в 0,57 рази більша, ніж у жінок, припускаючи, що кількість практичних іспитів залишається постійною .
Ми також можемо сказати, що чоловіки мають (1 – 0,57) на 43% менше шансів скласти іспит, ніж жінки, знову ж припускаючи, що кількість практичних іспитів залишається незмінною .
Як інтерпретувати практичні іспити (безперервна прогностична змінна)
Ми бачимо, що оцінка коефіцієнта для практичних іспитів позитивна, що вказує на те, що кожен додатковий практичний іспит збільшує шанси на складання підсумкового іспиту.
Ми також бачимо, що p-значення для кількості складених практичних іспитів менше 0,05, що означає, що воно має статистично значущий вплив на те, складе чи ні особа випускний іспит.
Для кількісної оцінки впливу кожного додаткового практичного іспиту на те, чи складе особа випускний іспит чи ні, ми можемо використати формулу e β .
e 1,13 = 3,09
Ми інтерпретуємо це так, що кожен додатковий складений практичний іспит збільшує шанс скласти випускний іспит на 3,09 , припускаючи, що стать залишається незмінною .
Ми також можемо сказати, що кожен додатковий складений практичний іспит пов’язаний зі збільшенням (3,09 – 1) 209% шансів на складання підсумкового іспиту, знову ж таки припускаючи, що стать залишається незмінною.
Примітка . Зверніться до цієї статті , щоб дізнатися, як інтерпретувати вихідний термін у моделі логістичної регресії.
Додаткові ресурси
Наступні посібники надають додаткову інформацію про логістичну регресію:
Як звітувати про результати логістичної регресії
Розуміння нульової гіпотези для логістичної регресії
Відмінність логістичної регресії від лінійної регресії