Как выполнить логистическую регрессию в google sheets


Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной.

В следующем пошаговом примере показано, как выполнить логистическую регрессию в Google Sheets.

Шаг 1. Установите пакет инструментов анализа XLMiner.

Чтобы выполнить логистическую регрессию в Google Sheets, нам сначала нужно установить бесплатный пакет XLMiner Analysis Toolpak .

Для этого нажмите Дополнения > Получить дополнения :

Затем введите XLMiner Analysis ToolPak в строку поиска и щелкните появившийся значок:

Установите пакет инструментов XLMiner Analytics в Google Sheets.

Наконец, нажмите синюю кнопку «Установить» .

Пакет инструментов анализа XLMiner в Google Таблицах

Шаг 2: Введите данные

Далее мы введем в Google Таблицы следующие данные:

Мы подберем модель логистической регрессии, которая использует очки и помогает предсказать, будет ли баскетболист выбран в НБА (0 = Нет, 1 = Да).

Шаг 3. Выполните логистическую регрессию

Чтобы соответствовать модели логистической регрессии, перейдите на вкладку «Расширения» , затем нажмите «XL Miner Analysis ToolPak» и нажмите «Пуск» :

На панели, которая появляется в правой части экрана, щелкните стрелку раскрывающегося списка рядом с пунктом «Логистическая регрессия» и введите следующую информацию:

логистическая регрессия в Google Sheets

Как только вы нажмете «ОК» , отобразится сводная информация о модели логистической регрессии:

выходные данные логистической регрессии в Google Sheets

Коэффициенты в результате указывают на среднее логарифмическое изменение шансов быть выбранным.

Например, увеличение на одно очко связано со средним увеличением шансов быть выбранным на 0,212 .

Знак коэффициентов говорит нам, есть ли связанный положительный или отрицательный результат между каждой переменной-предиктором и переменной ответа.

Например, поскольку очки имеют положительный знак коэффициента, это означает, что увеличение значения очков увеличивает шансы игрока быть выбранным (при условии, что результативные передачи остаются постоянными).

И наоборот, поскольку передачи имеют отрицательный знак коэффициента, это означает, что увеличение ценности передач снижает вероятность того, что игрок будет выбран (при условии, что очки остаются постоянными).

Значения p в результате также дают нам представление о том, насколько эффективна каждая переменная-предиктор в прогнозировании вероятности быть выбранным:

  • Значение P для баллов: 0,02
  • P-значение для передач: 0,35.

Мы видим, что баллы кажутся статистически значимой предикторской переменной, поскольку они имеют значение p меньше 0,05, но ассисты не кажутся статистически значимыми, поскольку они не имеют значения p меньше 0,05.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в Google Таблицах:

Как выполнить полиномиальную регрессию в Google Sheets
Как выполнить линейную регрессию в Google Sheets
Как посчитать R-квадрат в Google Таблицах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *