Hassasiyete karşı pozitif tahmin değeri: fark nedir?
Bir sınıflandırma modelinin performansını değerlendirmenin en yaygın yollarından biri, modelin tahmin edilen sonuçlarını veri kümesinin gerçek sonuçlarına göre özetleyen bir karışıklık matrisi oluşturmaktır.
Karışıklık matrisinde sıklıkla ilgilendiğimiz iki ölçüm pozitif tahmin değeri ve hassasiyettir .
Pozitif tahmin değeri, pozitif tahmin edilen sonuca sahip bir gözlemin gerçekte pozitif bir sonuca sahip olma olasılığıdır.
Aşağıdaki şekilde hesaplanır:
Pozitif tahmin değeri = Gerçek Pozitifler / (Doğru Pozitifler + Yanlış Pozitifler)
Duyarlılık , pozitif sonuç veren bir gözlemin gerçekte pozitif tahmin edilen sonuca sahip olma olasılığıdır.
Aşağıdaki şekilde hesaplanır:
Hassasiyet = Gerçek Pozitifler / (Doğru Pozitifler + Yanlış Negatifler)
Aşağıdaki örnekte bu iki metriğin pratikte nasıl hesaplanacağı gösterilmektedir.
Örnek: Pozitif tahmin değerinin ve duyarlılığın hesaplanması
Bir doktorun 400 kişinin belirli bir hastalığa sahip olup olmadığını tahmin etmek için lojistik regresyon modeli kullandığını varsayalım.
Aşağıdaki karışıklık matrisi, modelin yaptığı tahminleri özetlemektedir:
Pozitif tahmin değerini şu şekilde hesaplayabiliriz:
- Pozitif tahmin değeri = Gerçek Pozitifler / (Doğru Pozitifler + Yanlış Pozitifler)
- Pozitif öngörü değeri = 15 / (15 + 10)
- Pozitif tahmin değeri = 0,60
Bu bize test sonucu pozitif çıkan birinin gerçekten hastalığa sahip olma olasılığının 0,60 olduğunu söylüyor.
Duyarlılığı şu şekilde hesaplayabiliriz:
- Hassasiyet = Gerçek Pozitifler / (Doğru Pozitifler + Yanlış Negatifler)
- Hassasiyet = 15 / (15 + 5)
- Hassasiyet = 0,75
Bu bize, hastalığa sahip birinin gerçekten pozitif test sonucu alma ihtimalinin 0,75 olduğunu söylüyor.
Ek kaynaklar
Aşağıdaki eğitimler, farklı istatistiksel yazılımlarda karışıklık matrisinin nasıl oluşturulacağını açıklamaktadır:
Excel’de Karışıklık Matrisi Nasıl Oluşturulur
R’de bir karışıklık matrisi nasıl oluşturulur
Python’da Karışıklık Matrisi Nasıl Oluşturulur