Как выполнить логистическую регрессию в google sheets
Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной.
В следующем пошаговом примере показано, как выполнить логистическую регрессию в Google Sheets.
Шаг 1. Установите пакет инструментов анализа XLMiner.
Чтобы выполнить логистическую регрессию в Google Sheets, нам сначала нужно установить бесплатный пакет XLMiner Analysis Toolpak .
Для этого нажмите Дополнения > Получить дополнения :
Затем введите XLMiner Analysis ToolPak в строку поиска и щелкните появившийся значок:
Наконец, нажмите синюю кнопку «Установить» .
Шаг 2: Введите данные
Далее мы введем в Google Таблицы следующие данные:
Мы подберем модель логистической регрессии, которая использует очки и помогает предсказать, будет ли баскетболист выбран в НБА (0 = Нет, 1 = Да).
Шаг 3. Выполните логистическую регрессию
Чтобы соответствовать модели логистической регрессии, перейдите на вкладку «Расширения» , затем нажмите «XL Miner Analysis ToolPak» и нажмите «Пуск» :
На панели, которая появляется в правой части экрана, щелкните стрелку раскрывающегося списка рядом с пунктом «Логистическая регрессия» и введите следующую информацию:
Как только вы нажмете «ОК» , отобразится сводная информация о модели логистической регрессии:
Коэффициенты в результате указывают на среднее логарифмическое изменение шансов быть выбранным.
Например, увеличение на одно очко связано со средним увеличением шансов быть выбранным на 0,212 .
Знак коэффициентов говорит нам, есть ли связанный положительный или отрицательный результат между каждой переменной-предиктором и переменной ответа.
Например, поскольку очки имеют положительный знак коэффициента, это означает, что увеличение значения очков увеличивает шансы игрока быть выбранным (при условии, что результативные передачи остаются постоянными).
И наоборот, поскольку передачи имеют отрицательный знак коэффициента, это означает, что увеличение ценности передач снижает вероятность того, что игрок будет выбран (при условии, что очки остаются постоянными).
Значения p в результате также дают нам представление о том, насколько эффективна каждая переменная-предиктор в прогнозировании вероятности быть выбранным:
- Значение P для баллов: 0,02
- P-значение для передач: 0,35.
Мы видим, что баллы кажутся статистически значимой предикторской переменной, поскольку они имеют значение p меньше 0,05, но ассисты не кажутся статистически значимыми, поскольку они не имеют значения p меньше 0,05.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в Google Таблицах:
Как выполнить полиномиальную регрессию в Google Sheets
Как выполнить линейную регрессию в Google Sheets
Как посчитать R-квадрат в Google Таблицах