Как интерпретировать коэффициенты логистической регрессии (с примером)


Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной.

Когда мы подгоняем модель логистической регрессии, коэффициенты результатов модели представляют собой среднее изменение логарифмической вероятности переменной ответа, связанное с увеличением на одну единицу предикторной переменной.

 β = Average Change in Log Odds of Response Variable

Мы часто хотим понять среднее изменение вероятностей переменной отклика, связанное с увеличением на одну единицу переменной-предиктора, которое мы можем найти с помощью формулы e β .

 e β = Average Change in Odds of Response Variable

В следующем примере показано, как на практике интерпретировать коэффициенты логистической регрессии.

Пример: Как интерпретировать коэффициенты логистической регрессии

Предположим, мы хотим подобрать модель логистической регрессии, используя пол и количество сданных практических экзаменов, чтобы предсказать, сдаст ли студент выпускной экзамен в классе.

Предположим, мы аппроксимируем модель с помощью статистического программного обеспечения (например, R, Python , Excel или SAS ) и получаем следующий результат:

Оценка коэффициента Стандартная ошибка Z-значение P-значение
Перехват -1,34 0,23 5,83 <0,001
Мужской пол) -0,56 0,25 2.24 0,03
Практические экзамены 1.13 0,43 2,63 0,01

Как интерпретировать пол (двоичная переменная-предиктор)

Мы видим, что оценка коэффициента для пола отрицательна, что указывает на то, что принадлежность к мужскому полу снижает шансы на сдачу экзамена.

Мы также видим, что значение p для пола меньше 0,05, а это означает, что оно оказывает статистически значимое влияние на то, сдаст ли человек экзамен или нет.

Чтобы точно понять, как принадлежность к мужскому полу влияет на то, сдаст ли человек экзамен, мы можем использовать формулу e β .

е -0,56 = 0,57

Мы интерпретируем это как означающее, что вероятность сдачи экзамена у мужчин всего в 0,57 раза выше, чем у женщин, при условии, что количество практических экзаменов остается постоянным .

Мы могли бы также сказать, что у мужчин (1 – 0,57) 43% меньше шансов сдать экзамен, чем у женщин, опять же предполагая, что количество практических экзаменов остается постоянным .

Как интерпретировать практические экзамены (непрерывная прогностическая переменная)

Мы видим, что оценка коэффициента для практических экзаменов положительна, что указывает на то, что каждый дополнительный практический экзамен увеличивает шансы на сдачу итогового экзамена.

Мы также видим, что значение p для количества сданных практических экзаменов меньше 0,05, а это означает, что оно оказывает статистически значимое влияние на то, сдаст ли человек итоговый экзамен или нет.

Чтобы количественно оценить влияние каждого дополнительного практического экзамена на то, сдаст ли человек итоговый экзамен, мы можем использовать формулу e β .

е 1,13 = 3,09

Мы интерпретируем это так, что каждый дополнительный практический экзамен увеличивает вероятность сдачи выпускного экзамена на 3,09 , при условии, что пол остается неизменным .

Мы могли бы также сказать, что каждый дополнительный практический экзамен связан с увеличением (3,09 – 1) 209% шансов на сдачу итогового экзамена, опять же при условии, что пол остается неизменным.

Примечание . Обратитесь к этой статье , чтобы узнать, как интерпретировать исходный термин в модели логистической регрессии.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о логистической регрессии:

Как сообщить о результатах логистической регрессии
Понимание нулевой гипотезы логистической регрессии
Разница между логистической регрессией и линейной регрессией

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *