Как интерпретировать перехват логистической регрессии (с примером)
Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной.
Когда мы подгоняем модель логистической регрессии, исходный член в выходных данных модели представляет собой логарифмические шансы переменной ответа, возникающей , когда все переменные-предикторы равны нулю.
Однако, поскольку логарифмические вероятности трудно интерпретировать, мы обычно формулируем перехват с точки зрения вероятности.
Мы можем использовать следующую формулу, чтобы понять вероятность появления переменной отклика, учитывая, что каждая переменная-предиктор в модели равна нулю:
P = e β 0 / (1 +e β 0 )
В следующем примере показано, как на практике интерпретировать перехват логистической регрессии.
Связанный: Как интерпретировать коэффициенты логистической регрессии
Пример: Как интерпретировать перехват логистической регрессии
Предположим, мы хотим подобрать модель логистической регрессии, используя пол и количество сданных практических экзаменов, чтобы предсказать, сдаст ли студент выпускной экзамен в классе.
Предположим, мы аппроксимируем модель с помощью статистического программного обеспечения (например, R, Python , Excel или SAS ) и получаем следующий результат:
Оценка коэффициента | Стандартная ошибка | Z-значение | P-значение | |
---|---|---|---|---|
Перехват | -1,34 | 0,23 | 5,83 | <0,001 |
Пол (Мужской = 1) | -0,56 | 0,25 | 2.24 | 0,03 |
Практические экзамены | 1.13 | 0,43 | 2,63 | 0,01 |
Мы видим, что исходный термин имеет значение -1,34 .
Это означает, что когда пол равен нулю (т. е. студент — женщина) и когда практические экзамены равны нулю (студент не сдавал никаких практических экзаменов при подготовке к выпускному экзамену), логарифмический шанс того, что студент сдаст экзамен, равен -1,34 . . .
Поскольку логарифмические шансы трудно понять, вместо этого мы можем переписать вещи с точки зрения вероятности:
- Вероятность успеха = e β 0 / (1 +e β 0 )
- Вероятность успеха = e -1,34 / (1 +e -1,34 )
- Вероятность успеха = 0,208
Когда обе предикторные переменные равны нулю (т. е. студент не сдавал никаких подготовительных экзаменов), вероятность того, что студент сдаст итоговый экзамен, равна 0,208 .
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о логистической регрессии:
Как сообщить о результатах логистической регрессии
Понимание нулевой гипотезы логистической регрессии
Разница между логистической регрессией и линейной регрессией