Повний посібник: як звітувати про результати логістичної регресії
Логістична регресія – це тип регресійного аналізу, який ми використовуємо, коли змінна відповіді є двійковою.
Ми можемо використовувати наступний загальний формат для звіту про результати моделі логістичної регресії:
Логістичну регресію використовували для аналізу зв’язку між [прогностичною змінною 1], [провісницькою змінною 2],…[провісницькою змінною n ] і [змінною відповіді].
Було виявлено, що якщо всі інші змінні предиктора залишаються постійними, ймовірність [змінної відповіді] [збільшується або зменшується] на [кілька відсотків] (95% ДІ [нижня межа, верхня межа]) для збільшення на одну одиницю в [змінна предиктора 1].
Було виявлено, що якщо всі інші змінні предиктора залишаються постійними, ймовірність [змінної відповіді] [збільшується або зменшується] на [кілька відсотків] (95% ДІ [нижня межа, верхня межа]) для збільшення на одну одиницю в [провісник змінної 2].
…
Ми можемо використовувати цей базовий синтаксис, щоб повідомити про коефіцієнти шансів і відповідний 95% довірчий інтервал для коефіцієнтів шансів кожної змінної предиктора в моделі.
У наступному прикладі показано, як звітувати про результати моделі логістичної регресії на практиці.
Приклад: звітування про результати логістичної регресії
Припустімо, професор хоче зрозуміти, чи впливають дві різні програми навчання (програма A та програма B) і кількість вивчених годин на ймовірність того, що студент складе випускний іспит у своєму класі.
Він підходить для моделі логістичної регресії, використовуючи навчальні години та навчальну програму як змінні прогнозу, а результат іспиту (склав чи не склав) як змінну відповіді.
Наступні результати показують результати моделі логістичної регресії:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003
Перш ніж оприлюднити результати моделі логістичної регресії, ми повинні спочатку обчислити відношення шансів для кожної змінної предиктора за допомогою формули e β .
Наприклад, ось як обчислити відношення шансів для кожної змінної предиктора:
- Коефіцієнт шансів програми: e 0,344 = 1,41
- Коефіцієнт шансів годин: e 0,006 = 1,006
Нам також потрібно обчислити 95% довірчий інтервал для співвідношення шансів кожної змінної предиктора за допомогою формули e (β +/- 1,96*стандартна помилка) .
Наприклад, ось як обчислити відношення шансів для кожної змінної предиктора:
- 95% ДІ для співвідношення шансів програми: e 0,344 +/- 1,96*0,156 = [1,04, 1,92]
- 95% ДІ для співвідношення шансів годин: e 0,006 +/- 1,96*0,002 = [1,002, 1,009]
Тепер, коли ми розрахували відношення шансів і відповідний довірчий інтервал для кожної змінної предиктора, ми можемо повідомити про результати моделі таким чином:
Логістичну регресію було використано для аналізу зв’язку між навчальним планом і вивченими годинами на ймовірність здачі підсумкового іспиту.
Було виявлено, що при незмінній кількості навчальних годин шанси скласти підсумковий іспит зросли на 41% (95% ДІ [0,04, 0,92]) для студентів, які використовували навчальну програму А, порівняно з навчальною програмою Б.
Було також виявлено, що за умови незмінної навчальної програми шанси на складання підсумкового іспиту збільшувалися на 0,6% (95% ДІ [0,002, 0,009]) за кожну додаткову годину навчання.
Зауважте, що ми повідомили про співвідношення шансів для змінних предиктора на відміну від значень бета-версії моделі, оскільки співвідношення шансів легше інтерпретувати та зрозуміти.
Додаткові ресурси
Наступні посібники надають додаткову інформацію про логістичну регресію:
Вступ до логістичної регресії
Як виконати логістичну регресію в R
Як виконати логістичну регресію в Python
4 приклади використання логістичної регресії в реальному житті