Yate süreklilik düzeltmesi: tanım ve örnek
İki kategorik değişken arasında anlamlı bir ilişkinin olup olmadığını belirlemek için ki-kare bağımsızlık testi kullanılır.
Bu test aşağıdaki boş ve alternatif hipotezleri kullanır:
- H 0 : (sıfır hipotezi) İki değişken bağımsızdır.
- H 1 : (alternatif hipotez) İki değişken bağımsız değildir . (yani ilişkilidirler)
Bu test için Ki-kare x 2 test istatistiğini hesaplamak için aşağıdaki formülü kullanıyoruz:
X 2 = Σ(O ben -E ben ) 2 / E ben
Altın:
- Σ: “toplam” anlamına gelen süslü bir semboldür
- O: gözlemlenen değer
- E: beklenen değer
Bu test, bir beklenmedik durum tablosundaki frekansların ayrık olasılıklarının, sürekli bir dağılım olan Ki-kare dağılımı ile yaklaşık olarak tahmin edilebileceğini varsayar.
Ancak bu varsayım biraz yanlış olma eğilimindedir ve sonuçta ortaya çıkan test istatistikleri yukarı doğru sapma eğilimindedir.
Bu yanlılığı düzeltmek için, X2 formülüne aşağıdaki düzeltmeyi uygulayan Yate’in süreklilik düzeltmesini uygulayabiliriz :
X 2 = Σ(|O i -E ben | – 0,5) 2 / E ben
Genellikle bu düzeltmeyi yalnızca beklenmedik durum tablosundaki en az bir hücrenin beklenen frekansı 5’ten az olduğunda kullanırız.
Örnek: Yate’in süreklilik düzeltmesinin uygulanması
Cinsiyetin siyasi parti tercihiyle ilişkili olup olmadığını bilmek istediğimizi varsayalım. 40 seçmenden oluşan basit rastgele bir örneklem alıyoruz ve onlara siyasi parti tercihlerini soruyoruz. Aşağıdaki tabloda anketin sonuçları sunulmaktadır:
Yate’in süreklilik düzeltmesi ile ki-kare bağımsızlık testini şu şekilde gerçekleştirebilirsiniz:
Gözlemlenen değerler:
Beklenen değerler:
Not: Her hücredeki beklenen değeri, satır toplamını sütun toplamıyla çarpıp genel toplama bölerek hesaplıyoruz. Örneğin Cumhuriyetçi erkeklerin beklenen sayısı (21*19)/40 = 9.975’tir.
Ki – kare testi istatistiği :
- (|8-9,975| – 0,5) 2 / 9,975 = 0,218
- (|9-6,3| – 0,5) 2 / 6,3 = 0,768
- (|4-4,725| – 0,5) 2 / 4,725 = 0,011
- (|11-9,025| – 0,5) 2 / 9,025 = 0,241
- (|3-5,7| – 0,5) 2 / 5,7 = 0,849
- (|5-4,275| – 0,5) 2 / 4,275 = 0,012
Yani ,
P-değeri: Ki-kare-P-değeri hesaplayıcısına göre, 2 serbestlik derecesine sahip bir ki-kare test istatistiğine karşılık gelen p-değeri 0,3501’dir .
Bu p değeri 0,05’ten küçük olmadığından sıfır hipotezini reddetmede başarısız olacağız. Bu, cinsiyet ile siyasi parti tercihleri arasında bir ilişki olduğunu söyleyecek yeterli kanıta sahip olmadığımız anlamına geliyor.