Як створити матрицю плутанини в excel
Логістична регресія – це тип регресії, який ми можемо використовувати, коли змінна відповіді є двійковою.
Поширеним способом оцінки якості моделі логістичної регресії є створення матриці плутанини , яка є таблицею 2 × 2, яка показує прогнозовані значення моделі порівняно з фактичними значеннями тестового набору даних.
У наступному покроковому прикладі показано, як створити матрицю плутанини в Excel.
Крок 1: Введіть дані
Спочатку давайте введемо стовпець фактичних значень для змінної відповіді разом із значеннями, передбаченими моделлю логістичної регресії:
Крок 2: Створіть матрицю плутанини
Далі ми використаємо формулу COUNTIFS() , щоб підрахувати кількість значень, які мають значення «0» у стовпці «Фактичний», а також «0» у стовпці «Прогноз»:
Ми використаємо подібну формулу, щоб заповнити всі інші клітинки в матриці помилок:
Крок 3: обчисліть точність, точність і відкликання
Після того, як ми створили матрицю плутанини, ми можемо розрахувати такі показники:
- Точність : відсоток правильних прогнозів
- Точність : правильні позитивні прогнози відносно загальної кількості позитивних прогнозів
- Нагадування : виправлення позитивних прогнозів проти загальних фактичних позитивних результатів
Наведені нижче формули показують, як обчислити кожне з цих вимірювань у Excel:
Чим вища точність, тим більше модель здатна правильно класифікувати спостереження.
У цьому прикладі наша модель має точність 0,7 , що говорить нам, що вона правильно класифікувала 70% спостережень.
Якщо ми хочемо, ми можемо порівняти цю точність з точністю інших моделей логістичної регресії, щоб визначити, яка модель найкраще класифікує спостереження за категоріями 0 або 1.
Додаткові ресурси
Вступ до логістичної регресії
3 типи логістичної регресії
Логістична регресія проти лінійної регресії