Как создать матрицу путаницы в excel
Логистическая регрессия — это тип регрессии, который мы можем использовать, когда переменная ответа является двоичной.
Распространенный способ оценить качество модели логистической регрессии — создать матрицу путаницы , которая представляет собой таблицу 2 × 2, в которой показаны прогнозируемые значения модели в сравнении с фактическими значениями набора тестовых данных.
В следующем пошаговом примере показано, как создать матрицу путаницы в Excel.
Шаг 1: Введите данные
Сначала давайте введем столбец фактических значений для переменной ответа вместе со значениями, предсказанными моделью логистической регрессии:
Шаг 2. Создайте матрицу путаницы
Далее мы будем использовать формулу COUNTIFS() для подсчета количества значений, которые равны «0» в столбце «Фактическое», а также «0» в столбце «Прогнозировано»:
Мы будем использовать аналогичную формулу для заполнения всех остальных ячеек в матрице путаницы:
Шаг 3: Рассчитайте точность, точность и полноту
Создав матрицу путаницы, мы можем рассчитать следующие показатели:
- Точность : процент правильных прогнозов.
- Точность : правильные положительные прогнозы относительно общего числа положительных прогнозов.
- Напоминание : корректировка положительных прогнозов по сравнению с общим фактическим положительным результатом.
Следующие формулы показывают, как рассчитать каждое из этих измерений в Excel:
Чем выше точность, тем лучше модель способна правильно классифицировать наблюдения.
В этом примере наша модель имеет точность 0,7 , что говорит нам о том, что она правильно классифицировала 70% наблюдений.
Если мы захотим, мы можем сравнить эту точность с точностью других моделей логистической регрессии, чтобы определить, какая модель лучше всего классифицирует наблюдения по категориям 0 или 1.
Дополнительные ресурсы
Введение в логистическую регрессию
3 типа логистической регрессии
Логистическая регрессия против линейной регрессии