Excel'de karışıklık matrisi nasıl oluşturulur
Lojistik regresyon , yanıt değişkeni ikili olduğunda kullanabileceğimiz bir regresyon türüdür.
Lojistik regresyon modelinin kalitesini değerlendirmenin yaygın bir yolu, modelin tahmin edilen değerleri ile test veri kümesinin gerçek değerlerini gösteren 2×2’lik bir tablo olan bir karışıklık matrisi oluşturmaktır.
Aşağıdaki adım adım örnek, Excel’de bir karışıklık matrisinin nasıl oluşturulacağını gösterir.
1. Adım: Verileri girin
İlk olarak, bir yanıt değişkeni için lojistik regresyon modelinin öngördüğü değerlerle birlikte gerçek değerlerin yer aldığı bir sütuna girelim:
Adım 2: Karışıklık Matrisini Oluşturun
Daha sonra, Gerçek sütununda “0” olan ve ayrıca Tahmin edilen sütununda “0” olan değerlerin sayısını saymak için COUNTIFS() formülünü kullanacağız:
Karışıklık matrisindeki diğer tüm hücreleri doldurmak için benzer bir formül kullanacağız:
3. Adım: Doğruluğu, Hassasiyeti Hesaplayın ve Geri Çağırma
Karışıklık matrisini oluşturduktan sonra aşağıdaki metrikleri hesaplayabiliriz:
- Doğruluk : Doğru tahminlerin yüzdesi
- Doğruluk : Pozitif tahminleri toplam pozitif tahminlere göre düzeltin
- Hatırlatma : Pozitif tahminlerin toplam gerçek pozitiflere göre düzeltilmesi
Aşağıdaki formüller bu ölçümlerin her birinin Excel’de nasıl hesaplanacağını gösterir:
Kesinlik ne kadar yüksek olursa, model gözlemleri o kadar doğru şekilde sınıflandırabilir.
Bu örnekte modelimizin doğruluğu 0,7’dir ve bu bize gözlemlerin %70’ini doğru şekilde sınıflandırdığını gösterir.
İstersek, gözlemleri 0 veya 1 kategorilerine ayırmada hangi modelin en iyi olduğunu belirlemek için bu doğruluğu diğer lojistik regresyon modelleriyle karşılaştırabiliriz.
Ek kaynaklar
Lojistik Regresyona Giriş
3 tür lojistik regresyon
Lojistik regresyon ve doğrusal regresyon