Как интерпретировать перехват логистической регрессии (с примером)


Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной.

Когда мы подгоняем модель логистической регрессии, исходный член в выходных данных модели представляет собой логарифмические шансы переменной ответа, возникающей , когда все переменные-предикторы равны нулю.

Однако, поскольку логарифмические вероятности трудно интерпретировать, мы обычно формулируем перехват с точки зрения вероятности.

Мы можем использовать следующую формулу, чтобы понять вероятность появления переменной отклика, учитывая, что каждая переменная-предиктор в модели равна нулю:

 P = e β 0 / (1 +e β 0 )

В следующем примере показано, как на практике интерпретировать перехват логистической регрессии.

Связанный: Как интерпретировать коэффициенты логистической регрессии

Пример: Как интерпретировать перехват логистической регрессии

Предположим, мы хотим подобрать модель логистической регрессии, используя пол и количество сданных практических экзаменов, чтобы предсказать, сдаст ли студент выпускной экзамен в классе.

Предположим, мы аппроксимируем модель с помощью статистического программного обеспечения (например, R, Python , Excel или SAS ) и получаем следующий результат:

Оценка коэффициента Стандартная ошибка Z-значение P-значение
Перехват -1,34 0,23 5,83 <0,001
Пол (Мужской = 1) -0,56 0,25 2.24 0,03
Практические экзамены 1.13 0,43 2,63 0,01

Мы видим, что исходный термин имеет значение -1,34 .

Это означает, что когда пол равен нулю (т. е. студент — женщина) и когда практические экзамены равны нулю (студент не сдавал никаких практических экзаменов при подготовке к выпускному экзамену), логарифмический шанс того, что студент сдаст экзамен, равен -1,34 . . .

Поскольку логарифмические шансы трудно понять, вместо этого мы можем переписать вещи с точки зрения вероятности:

  • Вероятность успеха = e β 0 / (1 +e β 0 )
  • Вероятность успеха = e -1,34 / (1 +e -1,34 )
  • Вероятность успеха = 0,208

Когда обе предикторные переменные равны нулю (т. е. студент не сдавал никаких подготовительных экзаменов), вероятность того, что студент сдаст итоговый экзамен, равна 0,208 .

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о логистической регрессии:

Как сообщить о результатах логистической регрессии
Понимание нулевой гипотезы логистической регрессии
Разница между логистической регрессией и линейной регрессией

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *