Stata'da roc eğrisi nasıl oluşturulur ve yorumlanır


Lojistik regresyon, yanıt değişkeni ikili olduğunda bir regresyon modeline uymak için kullandığımız istatistiksel bir yöntemdir. Lojistik regresyon modelinin bir veri kümesine ne kadar iyi uyduğunu değerlendirmek için aşağıdaki iki ölçüme bakabiliriz:

  • Duyarlılık: Sonuç gerçekten olumluyken, modelin bir gözlem için olumlu bir sonuç öngörme olasılığı.
  • Özgüllük: Sonuç gerçekten negatif olduğunda modelin bir gözlem için negatif bir sonuç öngörme olasılığı.

Bu iki ölçümü görselleştirmenin basit bir yolu, lojistik regresyon modelinin duyarlılığını ve özgüllüğünü gösteren bir grafik olan ROC eğrisi oluşturmaktır.

Bu eğitimde Stata’da bir ROC eğrisinin nasıl oluşturulacağı ve yorumlanacağı açıklanmaktadır.

Örnek: Stata’daki ROC eğrisi

Bu örnek için 189 anne için aşağıdaki değişkenleri içeren lbw adlı bir veri kümesi kullanacağız:

  • Düşük – bebeğin düşük doğum ağırlığına sahip olup olmadığı. 1 = evet, 0 = hayır.
  • yaş – annenin yaşı.
  • duman – annenin hamilelik sırasında sigara içip içmediği. 1 = evet, 0 = hayır.

Açıklayıcı değişkenler olarak yaş ve sigarayı, yanıt değişkeni olarak da düşük doğum ağırlığını kullanarak verilere bir lojistik regresyon modeli yerleştireceğiz. Daha sonra modelin verilere ne kadar iyi uyduğunu analiz etmek için bir ROC eğrisi oluşturacağız.

Adım 1: Verileri yükleyin ve görüntüleyin.

Aşağıdaki komutu kullanarak verileri yükleyin:

https://www.stata-press.com/data/r13/lbw adresini kullanın

Aşağıdaki komutu kullanarak veri kümesini hızlı bir şekilde anlayın:

özetlemek

Stata'da düşük doğum ağırlığı veri kümesi

Veri setinde 11 farklı değişken var ancak ilgilendiğimiz sadece üçü düşük seviye, yaş ve sigara kullanımıdır.

Adım 2: Lojistik regresyon modelini yerleştirin.

Lojistik regresyon modeline uymak için aşağıdaki komutu kullanın:

düşük yaş duman logit

Stata'da lojistik regresyon çıktısı

Adım 3: ROC eğrisini oluşturun.

Aşağıdaki komutu kullanarak model için ROC eğrisini oluşturabiliriz:

lroc

Stata'da ROC eğrisi

Adım 4: ROC eğrisini yorumlayın.

Lojistik regresyon modelini uydurduğumuzda, yordayıcı değişkenlerin değerlerine dayalı olarak belirli bir gözlemin pozitif sonuca sahip olma olasılığını hesaplamak için kullanılabilir.

Bir gözlemin pozitif olarak sınıflandırılması gerekip gerekmediğini belirlemek için, eşiğin üzerinde düzeltilmiş olasılığa sahip gözlemlerin pozitif olarak sınıflandırılacağı ve eşiğin altında düzeltilmiş olasılığa sahip tüm gözlemlerin negatif olarak sınıflandırılacağı şekilde bir eşik seçebiliriz. .

Örneğin eşik değerini 0,5 olarak seçtiğimizi varsayalım. Bu, düzeltilmiş olasılığı 0,5’ten büyük olan herhangi bir gözlemin pozitif sonuç vereceği, düzeltilmiş olasılığı 0,5’ten küçük veya ona eşit olan herhangi bir gözlemin ise negatif sonuç vereceği anlamına gelir.

ROC eğrisi bize eşik değeri 0’dan 1’e değiştikçe duyarlılık değerlerine karşı özgüllük 1’i gösterir. Duyarlılığı ve özgüllüğü yüksek olan bir model, grafiğin sol üst köşesini saran bir ROC eğrisine sahip olacaktır. Duyarlılığı ve özgüllüğü düşük olan bir model, 45 derecelik diyagonale yakın bir eğriye sahip olacaktır.

AUC (eğrinin altındaki alan), bize modelin pozitif ve negatif sonuçları ayırt etme yeteneği hakkında bir fikir verir. AUC, 0 ile 1 arasında değişebilir. AUC ne kadar yüksek olursa, model sonuçları doğru şekilde sınıflandırmada o kadar iyi olur. Örneğimizde AUC’nin 0,6111 olduğunu görebiliriz.

İki veya daha fazla modelin performansını karşılaştırmak için AUC’yi kullanabiliriz. En yüksek AUC’ye sahip model en iyi performansı gösterir.

Ek kaynaklar

Stata’da lojistik regresyon nasıl gerçekleştirilir?
Lojistik regresyon modelinin ROC eğrisi ve AUC’si nasıl yorumlanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir