Повний посібник: як звітувати про результати логістичної регресії


Логістична регресія – це тип регресійного аналізу, який ми використовуємо, коли змінна відповіді є двійковою.

Ми можемо використовувати наступний загальний формат для звіту про результати моделі логістичної регресії:

Логістичну регресію використовували для аналізу зв’язку між [прогностичною змінною 1], [провісницькою змінною 2],…[провісницькою змінною n ] і [змінною відповіді].

Було виявлено, що якщо всі інші змінні предиктора залишаються постійними, ймовірність [змінної відповіді] [збільшується або зменшується] на [кілька відсотків] (95% ДІ [нижня межа, верхня межа]) для збільшення на одну одиницю в [змінна предиктора 1].

Було виявлено, що якщо всі інші змінні предиктора залишаються постійними, ймовірність [змінної відповіді] [збільшується або зменшується] на [кілька відсотків] (95% ДІ [нижня межа, верхня межа]) для збільшення на одну одиницю в [провісник змінної 2].

Ми можемо використовувати цей базовий синтаксис, щоб повідомити про коефіцієнти шансів і відповідний 95% довірчий інтервал для коефіцієнтів шансів кожної змінної предиктора в моделі.

У наступному прикладі показано, як звітувати про результати моделі логістичної регресії на практиці.

Приклад: звітування про результати логістичної регресії

Припустімо, професор хоче зрозуміти, чи впливають дві різні програми навчання (програма A та програма B) і кількість вивчених годин на ймовірність того, що студент складе випускний іспит у своєму класі.

Він підходить для моделі логістичної регресії, використовуючи навчальні години та навчальну програму як змінні прогнозу, а результат іспиту (склав чи не склав) як змінну відповіді.

Наступні результати показують результати моделі логістичної регресії:

 Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003

Перш ніж оприлюднити результати моделі логістичної регресії, ми повинні спочатку обчислити відношення шансів для кожної змінної предиктора за допомогою формули e β .

Наприклад, ось як обчислити відношення шансів для кожної змінної предиктора:

  • Коефіцієнт шансів програми: e 0,344 = 1,41
  • Коефіцієнт шансів годин: e 0,006 = 1,006

Нам також потрібно обчислити 95% довірчий інтервал для співвідношення шансів кожної змінної предиктора за допомогою формули e (β +/- 1,96*стандартна помилка) .

Наприклад, ось як обчислити відношення шансів для кожної змінної предиктора:

  • 95% ДІ для співвідношення шансів програми: e 0,344 +/- 1,96*0,156 = [1,04, 1,92]
  • 95% ДІ для співвідношення шансів годин: e 0,006 +/- 1,96*0,002 = [1,002, 1,009]

Тепер, коли ми розрахували відношення шансів і відповідний довірчий інтервал для кожної змінної предиктора, ми можемо повідомити про результати моделі таким чином:

Логістичну регресію було використано для аналізу зв’язку між навчальним планом і вивченими годинами на ймовірність здачі підсумкового іспиту.

Було виявлено, що при незмінній кількості навчальних годин шанси скласти підсумковий іспит зросли на 41% (95% ДІ [0,04, 0,92]) для студентів, які використовували навчальну програму А, порівняно з навчальною програмою Б.

Було також виявлено, що за умови незмінної навчальної програми шанси на складання підсумкового іспиту збільшувалися на 0,6% (95% ДІ [0,002, 0,009]) за кожну додаткову годину навчання.

Зауважте, що ми повідомили про співвідношення шансів для змінних предиктора на відміну від значень бета-версії моделі, оскільки співвідношення шансів легше інтерпретувати та зрозуміти.

Додаткові ресурси

Наступні посібники надають додаткову інформацію про логістичну регресію:

Вступ до логістичної регресії
Як виконати логістичну регресію в R
Як виконати логістичну регресію в Python
4 приклади використання логістичної регресії в реальному житті

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *