Как выполнить логистическую регрессию в excel


Логистическая регрессия — это метод, который мы используем для подбора модели регрессии, когда переменная ответа является двоичной.

В этом руководстве объясняется, как выполнить логистическую регрессию в Excel.

Пример: логистическая регрессия в Excel

Используйте следующие шаги, чтобы выполнить логистическую регрессию в Excel для набора данных, указывающего, были ли баскетболисты колледжей призваны в НБА (драфт: 0 = нет, 1 = да) на основе их среднего балла. очков, подборов и передач в прошлом. время года.

Шаг 1: Введите данные.

Сначала введите следующие данные:

Необработанные данные в Excel

Шаг 2: Введите ячейки для коэффициентов регрессии.

Поскольку в модели есть три объясняющие переменные (pts, rebs, ast), мы создадим ячейки для трех коэффициентов регрессии плюс один для начала координат в модели. Для каждого из них мы установим значения 0,001, но оптимизируем их позже.

Логистическая регрессия в Excel

Далее нам нужно будет создать несколько новых столбцов, которые мы будем использовать для оптимизации этих коэффициентов регрессии, включая logit, e logit , вероятность и логарифм правдоподобия.

Шаг 3: Создайте значения для логита.

Далее мы создадим столбец logit, используя следующую формулу:

Уравнение логистической регрессии в Excel

Шаг 4: Создайте значения для e logit .

Далее мы создадим значения для e logit по следующей формуле:

Расчеты логистической регрессии в Excel

Шаг 5: Создайте значения вероятности.

Далее мы создадим значения вероятности, используя следующую формулу:

Шаг 6. Создайте значения логарифмической вероятности.

Далее мы создадим значения логарифмической вероятности, используя следующую формулу:

Логарифм правдоподобия = LN (Вероятность)

Шаг 7: Найдите сумму логарифмических вероятностей.

Наконец, мы найдем сумму логарифмических правдоподобий, то есть число, которое мы попытаемся максимизировать, чтобы найти коэффициенты регрессии.

Шаг 8: Используйте решатель для решения коэффициентов регрессии.

Если вы еще не установили решатель в Excel, выполните следующие действия:

  • Нажмите Файл .
  • Нажмите «Параметры» .
  • Нажмите Надстройки .
  • Щелкните Надстройка Solver , а затем нажмите Перейти .
  • В появившемся новом окне установите флажок рядом с надстройкой Solver , затем нажмите «Перейти» .

После установки решателя перейдите в группу «Анализ» на вкладке «Данные» и нажмите «Поиск решения» . Введите следующую информацию:

  • Поставьте цель: выберите ячейку H14, содержащую сумму вероятностей журнала.
  • Изменяя ячейки переменных: выберите диапазон ячеек B15: B18, который содержит коэффициенты регрессии.
  • Сделайте неограниченные переменные неотрицательными: снимите этот флажок.
  • Выберите метод решения: выберите нелинейную GRG.

Затем нажмите «Решить» .

Решатель автоматически вычисляет оценки коэффициента регрессии:

По умолчанию коэффициенты регрессии можно использовать для определения вероятности того, что проект = 0.

Однако обычно в логистической регрессии нас интересует вероятность того, что переменная ответа = 1.

Таким образом, мы можем просто поменять знаки каждого из коэффициентов регрессии:

логистическая регрессия в Excel

Эти коэффициенты регрессии теперь можно использовать для определения вероятности того, что проект = 1.

Например, предположим, что игрок набирает в среднем 14 очков за игру, 4 подбора за игру и 5 передач за игру. Вероятность того, что этого игрока задрафтуют в НБА, можно рассчитать следующим образом:

P(проект = 1) = e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5) / (1+e 3,681193 + 0,112827*(14 ) -0,39568*(4) – 0,67954*(5 ) ) = 0,57 .

Поскольку эта вероятность больше 0,5, мы прогнозируем, что этот игрок   его призывают в НБА.

Связанный: Как создать кривую ROC в Excel (шаг за шагом)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *