Excel'de karışıklık matrisi nasıl oluşturulur


Lojistik regresyon , yanıt değişkeni ikili olduğunda kullanabileceğimiz bir regresyon türüdür.

Lojistik regresyon modelinin kalitesini değerlendirmenin yaygın bir yolu, modelin tahmin edilen değerleri ile test veri kümesinin gerçek değerlerini gösteren 2×2’lik bir tablo olan bir karışıklık matrisi oluşturmaktır.

Aşağıdaki adım adım örnek, Excel’de bir karışıklık matrisinin nasıl oluşturulacağını gösterir.

1. Adım: Verileri girin

İlk olarak, bir yanıt değişkeni için lojistik regresyon modelinin öngördüğü değerlerle birlikte gerçek değerlerin yer aldığı bir sütuna girelim:

Adım 2: Karışıklık Matrisini Oluşturun

Daha sonra, Gerçek sütununda “0” olan ve ayrıca Tahmin edilen sütununda “0” olan değerlerin sayısını saymak için COUNTIFS() formülünü kullanacağız:

Karışıklık matrisindeki diğer tüm hücreleri doldurmak için benzer bir formül kullanacağız:

Excel'deki karışıklık matrisi

3. Adım: Doğruluğu, Hassasiyeti Hesaplayın ve Geri Çağırma

Karışıklık matrisini oluşturduktan sonra aşağıdaki metrikleri hesaplayabiliriz:

  • Doğruluk : Doğru tahminlerin yüzdesi
  • Doğruluk : Pozitif tahminleri toplam pozitif tahminlere göre düzeltin
  • Hatırlatma : Pozitif tahminlerin toplam gerçek pozitiflere göre düzeltilmesi

Aşağıdaki formüller bu ölçümlerin her birinin Excel’de nasıl hesaplanacağını gösterir:

Kesinlik ne kadar yüksek olursa, model gözlemleri o kadar doğru şekilde sınıflandırabilir.

Bu örnekte modelimizin doğruluğu 0,7’dir ve bu bize gözlemlerin %70’ini doğru şekilde sınıflandırdığını gösterir.

İstersek, gözlemleri 0 veya 1 kategorilerine ayırmada hangi modelin en iyi olduğunu belirlemek için bu doğruluğu diğer lojistik regresyon modelleriyle karşılaştırabiliriz.

Ek kaynaklar

Lojistik Regresyona Giriş
3 tür lojistik regresyon
Lojistik regresyon ve doğrusal regresyon

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir