Як створити матрицю плутанини в excel


Логістична регресія – це тип регресії, який ми можемо використовувати, коли змінна відповіді є двійковою.

Поширеним способом оцінки якості моделі логістичної регресії є створення матриці плутанини , яка є таблицею 2 × 2, яка показує прогнозовані значення моделі порівняно з фактичними значеннями тестового набору даних.

У наступному покроковому прикладі показано, як створити матрицю плутанини в Excel.

Крок 1: Введіть дані

Спочатку давайте введемо стовпець фактичних значень для змінної відповіді разом із значеннями, передбаченими моделлю логістичної регресії:

Крок 2: Створіть матрицю плутанини

Далі ми використаємо формулу COUNTIFS() , щоб підрахувати кількість значень, які мають значення «0» у стовпці «Фактичний», а також «0» у стовпці «Прогноз»:

Ми використаємо подібну формулу, щоб заповнити всі інші клітинки в матриці помилок:

матриця плутанини в Excel

Крок 3: обчисліть точність, точність і відкликання

Після того, як ми створили матрицю плутанини, ми можемо розрахувати такі показники:

  • Точність : відсоток правильних прогнозів
  • Точність : правильні позитивні прогнози відносно загальної кількості позитивних прогнозів
  • Нагадування : виправлення позитивних прогнозів проти загальних фактичних позитивних результатів

Наведені нижче формули показують, як обчислити кожне з цих вимірювань у Excel:

Чим вища точність, тим більше модель здатна правильно класифікувати спостереження.

У цьому прикладі наша модель має точність 0,7 , що говорить нам, що вона правильно класифікувала 70% спостережень.

Якщо ми хочемо, ми можемо порівняти цю точність з точністю інших моделей логістичної регресії, щоб визначити, яка модель найкраще класифікує спостереження за категоріями 0 або 1.

Додаткові ресурси

Вступ до логістичної регресії
3 типи логістичної регресії
Логістична регресія проти лінійної регресії

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *