Düzeltilmiş olasılık oranı: tanım + örnekler
İstatistiklerde olasılık oranı bize bir olayın tedavi grubunda meydana gelme olasılığı ile bir olayın kontrol grubunda meydana gelme olasılığı arasındaki oranı anlatır.
Olasılık oranları en yaygın olarak, bir veya daha fazla öngörücü değişkene ve ikili yanıt değişkenine sahip bir regresyon modeline uymak için kullandığımız bir yöntem olan lojistik regresyonda görünür.
Düzeltilmiş olasılık oranı, bir modeldeki diğer öngörücü değişkenler için ayarlanmış bir olasılık oranıdır.
Diğer öngörücü değişkenlerin etkisine göre ayarlama yapıldıktan sonra , bir yordayıcı değişkenin bir olayın meydana gelme şansını nasıl etkilediğini anlamamıza yardımcı olması açısından özellikle faydalıdır.
Aşağıdaki örnek, olasılık oranı ile düzeltilmiş olasılık oranı arasındaki farkı göstermektedir.
Örnek: Düzeltilmiş oran oranlarının hesaplanması
Bir annenin yaşının düşük doğum ağırlıklı bir bebeğe sahip olma olasılığını etkileyip etkilemediğini anlamak istediğimizi varsayalım.
Bunu araştırmak için, öngörücü değişken olarak yaşı ve yanıt değişkeni olarak düşük doğum ağırlığını (evet veya hayır) kullanarak lojistik regresyon gerçekleştirebiliriz.
300 anne hakkında veri topladığımızı ve lojistik regresyon modeline uyduğumuzu varsayalım. Sonuçlar burada:
Yaşa göre olasılık oranını elde etmek için katsayı tahminini tablodan üstel hale getirin: e 0,173 = 1,189 .
Bu bize yaştaki bir yıllık artışın, bebeğin düşük doğum ağırlığına sahip olma ihtimalinde 1.189 artışla ilişkili olduğunu söylüyor. Başka bir deyişle, yaştaki her bir yıllık artışla birlikte düşük doğum ağırlıklı bebek sahibi olma şansı %18,9 oranında artmaktadır.
Bu odds oranına “kaba” odds oranı veya “düzeltilmemiş” odds oranı denir çünkü modeldeki tek öngörücü değişken olduğundan modeldeki diğer yordayıcı değişkenler için ayarlanmamıştır.
Ancak bir annenin yaşının ve sigara içme alışkanlığının düşük doğum ağırlıklı bebek sahibi olma olasılığını etkileyip etkilemediğini anlamak istediğimizi varsayalım.
Bunu araştırmak için, öngörücü değişkenler olarak yaş ve sigara içmeyi (evet veya hayır) ve yanıt değişkeni olarak düşük doğum ağırlığını kullanarak lojistik regresyon gerçekleştirebiliriz.
300 anne hakkında veri topladığımızı ve lojistik regresyon modeline uyduğumuzu varsayalım. Sonuçlar burada:
Sonuçları nasıl yorumlayacağınız aşağıda açıklanmıştır:
Yaş: Yaşa göre düzeltilmiş odds oranı şu şekilde hesaplanır: e 0,045 = 1,046 . Bu, sigara içme değişkeninin sabit kaldığı varsayıldığında, yaştaki her ilave yıllık artış için düşük doğum ağırlıklı bir bebeğe sahip olma şansının %4,6 arttığı anlamına gelir.
Örneğin, Anne A ve Anne B’nin her ikisinin de sigara içtiğini varsayalım. Eğer anne A, anne B’den bir yaş büyükse, anne A’nın düşük doğum ağırlıklı bebek sahibi olma olasılığı, anne B’nin düşük doğum ağırlıklı bebek sahibi olma olasılığının 1.046 katıdır.
Sigara içme : Sigara içmeye ilişkin düzeltilmiş olasılık oranı şu şekilde hesaplanır: e.485 = 1.624 . Bu, yaş değişkeninin sabit kaldığı varsayıldığında, anne sigara içiyorsa (sigara içmemeye kıyasla) düşük doğum ağırlıklı bebek sahibi olma şansının %62,4 arttığı anlamına gelir.
Örneğin Anne A ve Anne B’nin her ikisinin de 30 yaşında olduğunu varsayalım. Anne A hamilelikte sigara içiyor ve anne B sigara içmiyorsa, anne A’nın düşük doğum ağırlıklı bebek sahibi olma şansı, anne B’nin düşük doğum ağırlıklı bebek sahibi olma ihtimalinden %62,4 daha yüksektir.
Yaşa göre düzeltilmiş olasılık oranının, önceki örnekteki düzeltilmemiş olasılık oranından daha düşük olduğunu unutmayın. Bunun nedeni, diğer yordayıcı değişkenler yanıt değişkeninin ortaya çıkma şansını arttırdığında, modelde halihazırda mevcut olan yordayıcı değişken için düzeltilmiş olasılık oranının her zaman azalacak olmasıdır.
Özet: olasılık oranı ve düzeltilmiş olasılık oranı
Olasılık oranı (bazen “kaba” olasılık oranı olarak da adlandırılır), yordayıcı değişkendeki değişikliklerin bir yanıt değişkeninin ortaya çıkma şansını nasıl etkilediğini bize anlatmada faydalıdır.
Düzeltilmiş olasılık oranı, bir modeldeki diğer öngörücü değişkenler kontrol edildikten sonra , bir yordayıcı değişkendeki değişikliklerin, bir yanıt değişkeninin ortaya çıkma şansını nasıl etkilediğini bize anlatmak açısından faydalıdır.
Ek kaynaklar
Lojistik Regresyona Giriş
R’de lojistik regresyon nasıl gerçekleştirilir
Python’da Lojistik Regresyon Nasıl Gerçekleştirilir