Положительная прогностическая ценность и чувствительность: в чем разница?
Одним из наиболее распространенных способов оценки эффективности модели классификации является создание матрицы путаницы, которая суммирует прогнозируемые результаты модели с фактическими результатами набора данных.
Два показателя, которые нас часто интересуют в матрице путаницы, — это положительная прогностическая ценность и чувствительность .
Положительная прогностическая ценность — это вероятность того, что наблюдение с положительным прогнозируемым результатом действительно имеет положительный результат.
Он рассчитывается следующим образом:
Положительная прогностическая ценность = Истинные положительные результаты / (Истинные положительные результаты + Ложные положительные результаты)
Чувствительность — это вероятность того, что наблюдение с положительным результатом действительно имеет положительный прогнозируемый результат.
Он рассчитывается следующим образом:
Чувствительность = Истинные положительные результаты / (Истинные положительные результаты + Ложноотрицательные результаты)
В следующем примере показано, как на практике рассчитать эти две метрики.
Пример: Расчет положительной прогностической ценности и чувствительности
Предположим, врач использует модель логистической регрессии , чтобы предсказать, есть ли у 400 человек определенное заболевание.
Следующая матрица путаницы суммирует прогнозы, сделанные моделью:
Мы могли бы рассчитать положительную прогностическую ценность следующим образом:
- Положительная прогностическая ценность = Истинные положительные результаты / (Истинные положительные результаты + Ложные положительные результаты)
- Положительная прогностическая ценность = 15 / (15 + 10)
- Положительная прогностическая ценность = 0,60.
Это говорит нам о том, что вероятность того, что кто-то, получивший положительный результат теста, действительно болен , равна 0,60 .
Чувствительность можно рассчитать следующим образом:
- Чувствительность = Истинные положительные результаты / (Истинные положительные результаты + Ложноотрицательные результаты)
- Чувствительность = 15 / (15 + 5)
- Чувствительность = 0,75
Это говорит нам о том, что вероятность того, что человек с этим заболеванием действительно получит положительный результат теста, равна 0,75 .
Дополнительные ресурсы
В следующих руководствах объясняется, как создать матрицу путаницы в различных статистических программах:
Как создать матрицу путаницы в Excel
Как создать матрицу путаницы в R
Как создать матрицу путаницы в Python