Lojistik regresyonun 6 hipotezi (örneklerle)


Lojistik regresyon, yanıt değişkeni ikili olduğunda bir regresyon modeline uymak için kullanabileceğimiz bir yöntemdir.

Lojistik regresyon, bir modeli bir veri kümesine yerleştirmeden önce aşağıdaki varsayımları yapar:

Varsayım #1: Yanıt değişkeni ikilidir

Lojistik regresyon, yanıt değişkeninin yalnızca iki olası sonucu olduğunu varsayar. İşte bazı örnekler:

  • Evet veya hayır
  • Erkek veya kadın
  • Başarılı veya başarısız
  • Yazılı veya yazısız
  • Kötü huylu veya iyi huylu

Bu varsayım nasıl kontrol edilir: Yanıt değişkeninde meydana gelen benzersiz sonuçların sayısını basitçe sayın. İkiden fazla olası sonuç varsa bunun yerine sıralı regresyon gerçekleştirmeniz gerekecektir.

Hipotez #2: gözlemler bağımsızdır

Lojistik regresyon, veri kümesindeki gözlemlerin birbirinden bağımsız olduğunu varsayar. Yani gözlemler aynı bireyin tekrarlanan ölçümlerinden gelmemeli veya hiçbir şekilde birbiriyle ilişkili olmamalıdır.

Bu hipotez nasıl test edilir: Bu hipotezi test etmenin en basit yolu, zamana karşı artıkların grafiğini (yani gözlem sırası) oluşturmak ve rastgele bir eğilim olup olmadığını gözlemlemektir. Eğer rastgele bir model yoksa bu varsayım ihlal edilebilir.

Hipotez #3: Açıklayıcı değişkenler arasında çoklu bağlantı yoktur

Lojistik regresyon, açıklayıcı değişkenler arasında ciddi bir çoklu bağlantının olmadığını varsayar.

Çoklu doğrusallık, iki veya daha fazla açıklayıcı değişkenin regresyon modelinde benzersiz veya bağımsız bilgi sağlamayacak şekilde birbiriyle yüksek düzeyde korelasyona sahip olması durumunda ortaya çıkar. Değişkenler arasındaki korelasyon derecesi yeterince yüksekse, bu durum modelin yerleştirilmesinde ve yorumlanmasında sorunlara neden olabilir.

Örneğin, yanıt değişkeni olarak maksimum dikey sıçramayı ve açıklayıcı değişkenler olarak aşağıdaki değişkenleri kullanarak bir lojistik regresyon gerçekleştirmek istediğinizi varsayalım:

  • Oyuncu boyutu
  • Oyuncu boyutu
  • Günde pratik yapmak için harcanan saatler

Bu durumda, uzun boylu insanlar daha büyük ayakkabı numaralarına sahip olma eğiliminde olduğundan, boy ve ayakkabı numarası muhtemelen yüksek oranda ilişkilidir. Bu, regresyonda bu iki değişkeni kullanırsak çoklu doğrusallığın muhtemelen bir sorun olacağı anlamına gelir.

Bu varsayım nasıl kontrol edilir: Çoklu doğrusallığı tespit etmenin en yaygın yolu, bir regresyon modelinde öngörücü değişkenler arasındaki korelasyonu ve korelasyonun gücünü ölçen varyans enflasyon faktörünü (VIF) kullanmaktır. VIF değerlerinin nasıl hesaplanacağı ve yorumlanacağına ilişkin ayrıntılı bir açıklama için bu eğitime göz atın.

Varsayım #4: Aşırı aykırı değerler yoktur

Lojistik regresyon, veri setinde aşırı aykırı değerlerin veya etkili gözlemlerin olmadığını varsayar.

Bu varsayım nasıl kontrol edilir: Bir veri kümesindeki aşırı aykırı değerleri ve etkili gözlemleri test etmenin en yaygın yolu, her gözlem için Cook mesafesini hesaplamaktır. Gerçekten aykırı değerler varsa, (1) bunları kaldırmayı, (2) bunları ortalama veya medyan gibi bir değerle değiştirmeyi veya (3) bunları yalnızca modelde tutmayı ancak regresyonu rapor ederken not etmeyi seçebilirsiniz. . sonuçlar.

Hipotez #5: Açıklayıcı değişkenler ile yanıt değişkeninin logiti arasında doğrusal bir ilişki vardır

Lojistik regresyon, her açıklayıcı değişken ile yanıt değişkeninin logiti arasında doğrusal bir ilişki olduğunu varsayar. Logit’in şu şekilde tanımlandığını hatırlayın:

Logit(p) = log(p / (1-p)) burada p pozitif bir sonucun olasılığıdır.

Bu hipotez nasıl test edilir: Bu hipotezin doğru olup olmadığını görmenin en kolay yolu Box-Tidwell testi kullanmaktır.

Varsayım #6: Örneklem büyüklüğü yeterince büyük

Lojistik regresyon, veri kümesinin örneklem boyutunun, uygun lojistik regresyon modelinden geçerli sonuçlar çıkarmaya yetecek kadar büyük olduğunu varsayar.

Bu hipotez nasıl kontrol edilir: Genel bir kural olarak, her açıklayıcı değişken için en az sıklıkta sonuca sahip en az 10 vakanız olmalıdır. Örneğin, 3 açıklayıcı değişkeniniz varsa ve en az sıklıkta olan sonucun beklenen olasılığı 0,20 ise, o zaman örneklem boyutunuz en az (10*3) / 0,20 = 150 olmalıdır.

Lojistik Regresyonun Varsayımları vs. Doğrusal Regresyon

Doğrusal regresyonun aksine lojistik regresyon şunları gerektirmez:

  • Açıklayıcı değişken(ler) ile yanıt değişkeni arasındaki doğrusal ilişki.
  • Modelin artıkları normal olarak dağıtılacaktır.
  • Artıkların sabit varyansı olması gerekir; bu aynı zamanda eşvaryans olarak da bilinir.

İlgili: Doğrusal Regresyonun Dört Varsayımı

Ek kaynaklar

Lojistik Regresyonun Gerçek Hayatta Kullanımına İlişkin 4 Örnek
SPSS’de lojistik regresyon nasıl yapılır
Excel’de Lojistik Regresyon Nasıl Gerçekleştirilir
Stata’da lojistik regresyon nasıl gerçekleştirilir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir