Stata'da lojistik regresyon nasıl gerçekleştirilir


Lojistik regresyon, yanıt değişkeni ikili olduğunda bir regresyon modeline uymak için kullandığımız bir yöntemdir. Lojistik regresyonun kullanımına ilişkin bazı örnekler:

  • Egzersiz, diyet ve kilonun kalp krizi geçirme olasılığını nasıl etkilediğini bilmek istiyoruz. Tepki değişkeni kalp krizidir ve bunun iki potansiyel sonucu vardır: kalp krizi meydana gelir veya gelmez.
  • GPA’nın, ACT puanının ve alınan AP dersleri sayısının belirli bir üniversiteye kabul edilme olasılığını nasıl etkilediğini bilmek istiyoruz. Yanıt değişkeni kabuldür ve iki potansiyel sonucu vardır: kabul edilmiş veya kabul edilmemiş.
  • Kelime sayısının ve e-posta başlığının bir e-postanın spam olma olasılığını etkileyip etkilemediğini bilmek istiyoruz. Yanıt değişkeni spam’dir ve iki potansiyel sonucu vardır: spam veya spam değil.

Bu eğitimde Stata’da lojistik regresyonun nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: Stata’da lojistik regresyon

Bir annenin yaşının ve sigara içme alışkanlığının düşük doğum ağırlıklı bebek sahibi olma olasılığını etkileyip etkilemediğini anlamak istediğimizi varsayalım.

Bunu araştırmak için, açıklayıcı değişkenler olarak yaş ve sigara içmeyi (evet veya hayır) ve yanıt değişkeni olarak düşük doğum ağırlığını (evet veya hayır) kullanarak lojistik regresyon yapabiliriz. Yanıt değişkeni ikili olduğundan (yalnızca iki olası sonuç vardır) lojistik regresyon kullanılmalıdır.

189 farklı anneye ilişkin verileri içeren lbw adlı veri kümesini kullanarak lojistik regresyon gerçekleştirmek için Stata’da aşağıdaki adımları tamamlayın.

Adım 1: Verileri yükleyin.

Komut kutusuna aşağıdakini yazarak verileri yükleyin:

https://www.stata-press.com/data/r13/lbw adresini kullanın

Adım 2: Bir veri özeti alın.

Komut kutusuna aşağıdakini yazarak, üzerinde çalıştığınız verileri hızlı bir şekilde anlayın:

özetlemek

Stata'da düşük doğum ağırlığı veri kümesi

Veri setinde 11 farklı değişken olduğunu görebiliyoruz ancak ilgilendiğimiz sadece üçü:

  • Düşük – bebeğin düşük doğum ağırlığına sahip olup olmadığı. 1 = evet, 0 = hayır.
  • yaş – annenin yaşı.
  • duman – annenin hamilelik sırasında sigara içip içmediği. 1 = evet, 0 = hayır.

Adım 3: Lojistik regresyon gerçekleştirin.

Açıklayıcı değişkenler olarak yaş ve dumanı ve yanıt değişkeni olarak düşük kullanarak lojistik regresyon gerçekleştirmek için komut kutusuna aşağıdakini yazın.

düşük yaş duman logit

Stata'da lojistik regresyon çıktısı

Sonuçtaki en ilginç sayıları nasıl yorumlayacağınız aşağıda açıklanmıştır:

Katsayı (yaş): -.0497792. Sigarayı sabit tuttuğunuzda, yaştaki her yıl artış, bir bebeğin düşük doğum ağırlığına sahip olma ihtimalinde exp(-0,0497792) = 0,951 artışla ilişkilidir. Bu sayının 1’den küçük olması, yaş artışının aslında düşük doğum ağırlıklı bebeğe sahip olma şansının azalmasıyla ilişkili olduğu anlamına gelir.

Örneğin, Anne A ve Anne B’nin her ikisinin de sigara içtiğini varsayalım. Eğer anne A, anne B’den bir yaş büyükse, o zaman anne A’nın düşük doğum ağırlıklı bir bebeğe sahip olma şansı, anne B’nin düşük doğum ağırlıklı bir bebeğe sahip olma ihtimalinin yalnızca %95,1’idir. doğum.

P>|z| (yaş): 0,119. Bu, yaşa ilişkin test istatistiğiyle ilişkili p değeridir. Bu değer 0,05’ten küçük olmadığından yaş, düşük doğum ağırlığının istatistiksel olarak anlamlı bir belirleyicisi değildir.

Olasılık oranı (duman): 0,6918486. Yaş sabit tutulduğunda, hamilelik sırasında sigara içen bir annenin düşük doğum ağırlıklı bebeğe sahip olma olasılığı, hamilelik sırasında sigara içmeyen bir anneye göre daha yüksektir (exp(.6918486) = 1.997).

Örneğin Anne A ve Anne B’nin her ikisinin de 30 yaşında olduğunu varsayalım. Anne A hamilelikte sigara içiyorsa ve anne B sigara içmiyorsa, anne A’nın düşük doğum ağırlıklı bebek sahibi olma şansı, anne B’nin düşük doğum ağırlıklı bebek sahibi olma ihtimalinden %99,7 daha yüksektir.

P>|z| (duman): 0,032. Bu, duman için test istatistiğiyle ilişkili p değeridir. Bu değer 0,05’ten küçük olduğundan sigara kullanımı düşük doğum ağırlığının istatistiksel olarak anlamlı bir yordayıcısıdır.

Adım 4: Sonuçları rapor edin.

Son olarak lojistik regresyonumuzun sonuçlarını bildirmek istiyoruz. İşte bunun nasıl yapılacağına dair bir örnek:

Annenin yaşının ve sigara içme alışkanlığının düşük doğum ağırlıklı bebek sahibi olma olasılığını etkileyip etkilemediğini belirlemek için lojistik regresyon uygulandı. Analizde 189 anneden oluşan bir örneklem kullanıldı.

Sonuçlar, sigara içme ile düşük doğum ağırlığı olasılığı arasında istatistiksel olarak anlamlı bir ilişki olduğunu (z = 2,15, p = 0,032), yaş ile düşük doğum ağırlığı olasılığı arasında ise istatistiksel olarak anlamlı bir ilişki olmadığını (z = -1,56) gösterdi. , p = 0,032). 119).

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir