Положительная прогностическая ценность и чувствительность: в чем разница?


Одним из наиболее распространенных способов оценки эффективности модели классификации является создание матрицы путаницы, которая суммирует прогнозируемые результаты модели с фактическими результатами набора данных.

Два показателя, которые нас часто интересуют в матрице путаницы, — это положительная прогностическая ценность и чувствительность .

Положительная прогностическая ценность — это вероятность того, что наблюдение с положительным прогнозируемым результатом действительно имеет положительный результат.

Он рассчитывается следующим образом:

Положительная прогностическая ценность = Истинные положительные результаты / (Истинные положительные результаты + Ложные положительные результаты)

Чувствительность — это вероятность того, что наблюдение с положительным результатом действительно имеет положительный прогнозируемый результат.

Он рассчитывается следующим образом:

Чувствительность = Истинные положительные результаты / (Истинные положительные результаты + Ложноотрицательные результаты)

В следующем примере показано, как на практике рассчитать эти две метрики.

Пример: Расчет положительной прогностической ценности и чувствительности

Предположим, врач использует модель логистической регрессии , чтобы предсказать, есть ли у 400 человек определенное заболевание.

Следующая матрица путаницы суммирует прогнозы, сделанные моделью:

Мы могли бы рассчитать положительную прогностическую ценность следующим образом:

  • Положительная прогностическая ценность = Истинные положительные результаты / (Истинные положительные результаты + Ложные положительные результаты)
  • Положительная прогностическая ценность = 15 / (15 + 10)
  • Положительная прогностическая ценность = 0,60.

Это говорит нам о том, что вероятность того, что кто-то, получивший положительный результат теста, действительно болен , равна 0,60 .

Чувствительность можно рассчитать следующим образом:

  • Чувствительность = Истинные положительные результаты / (Истинные положительные результаты + Ложноотрицательные результаты)
  • Чувствительность = 15 / (15 + 5)
  • Чувствительность = 0,75

Это говорит нам о том, что вероятность того, что человек с этим заболеванием действительно получит положительный результат теста, равна 0,75 .

Дополнительные ресурсы

В следующих руководствах объясняется, как создать матрицу путаницы в различных статистических программах:

Как создать матрицу путаницы в Excel
Как создать матрицу путаницы в R
Как создать матрицу путаницы в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *