İstatistiklerde başarılı/başarısız durumu nedir?
Bir Bernoulli denemesi yalnızca iki olası sonucu olan bir deneydir – “başarılı” veya “başarısız” ve başarı olasılığı deney her yapıldığında aynıdır.
Bernoulli makalesinin bir örneği yazı tura atmaktır. Para yalnızca iki tura gelebilir (turalara “vuruş”, yazılara ise “başarısızlık” diyebiliriz) ve paranın adil olduğunu varsayarsak, her atışta başarı olasılığı 0,5’tir.
İstatistikte genellikle birkaç Bernoulli denemesinden fazlasını içeren olasılıkları hesaplamak istediğimizde yaklaşıklık olarak normal dağılımı kullanırız. Ancak bunu yapabilmek için başarılı/başarısız koşulunun karşılanıp karşılanmadığını kontrol etmemiz gerekir:
Başarılı/Başarısız Durumu: Normal dağılımın yaklaşık olarak kullanılabilmesi için bir numunede en az 10 beklenen başarı ve 10 beklenen başarısızlık olmalıdır.
Gösterimle yazıldığında aşağıdaki iki şeyi kontrol etmemiz gerekir:
- Beklenen başarı sayısı en az 10: np ≥ 10
- Beklenen arıza sayısı en az 10’dur: n(1-p) ≥ 10
burada n örneklem büyüklüğü ve p belirli bir deneme için başarı olasılığıdır.
Not: Bazı kılavuzlar normal yaklaşımı kullanmak için yalnızca 5 beklenen başarının ve 5 beklenen başarısızlığın gerekli olduğunu söylüyor. Ancak 10 daha yaygın olarak kullanılır ve daha ihtiyatlı bir sayıdır. Bu nedenle bu derste bu sayıyı kullanacağız.
Örnek: Başarılı/başarısız koşulunun kontrol edilmesi
Bir ilçede belirli bir yasayı destekleyen sakinlerin oranı için bir güven aralığı oluşturmak istediğimizi varsayalım. 100 sakinden rastgele bir örnek seçiyoruz ve onlara yasadaki konumlarının ne olduğunu soruyoruz. Sonuçlar burada:
- Örneklem büyüklüğü n = 100
- Kanun lehine oran p = 0,56
Güven aralığını hesaplamak için aşağıdaki formülü kullanmak istiyoruz:
Güven aralığı = p +/- z*√ p(1-p) / n
Altın:
- p: örnek oranı
- z: normal dağılıma karşılık gelen z değeri
- n: örneklem büyüklüğü
Bu formül normal dağılımdan az değerini kullanır. Dolayısıyla bu formülde binom dağılımına yaklaşmak için normal dağılımı kullanıyoruz.
Ancak bunu yapabilmek için başarılı/başarısız koşulunun karşılandığını doğrulamamız gerekir. Örnekteki başarılı ve başarısızlık sayısının en az 10 olduğunu kontrol edelim:
Başarı sayısı: np = 100*.56 = 56
Arıza sayısı: n(1-p) = 100*(1-.56) = 44
Her iki sayı da 10’a eşit veya 10’dan büyük olduğundan güven aralığını hesaplamak için yukarıdaki formülü kullanabiliriz.
Ek kaynaklar
Normal dağılımın binom dağılımına yaklaşım olarak kullanılabilmesi için yerine getirilmesi gereken bir diğer koşul da, üzerinde çalıştığımız örneklem büyüklüğünün evren büyüklüğünün %10’unu geçmemesidir. Buna %10 koşulu denir.
Ayrıca iki oran ile çalışıyorsanız (örneğin oranlar arasındaki fark için bir güven aralığı oluşturmak ), iki örnekte beklenen başarı ve başarısızlık sayısının en az 10 olduğunu kontrol etmeniz gerektiğini unutmayın.