Python'da ki-kare bağımsızlık testi nasıl yapılır?
Ki -kare bağımsızlık testi İki kategorik değişken arasında anlamlı bir ilişkinin olup olmadığını belirlemek için kullanılır.
Bu eğitimde Python’da ki-kare bağımsızlık testinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: Python’da ki-kare bağımsızlık testi
Cinsiyetin siyasi parti tercihiyle ilişkili olup olmadığını bilmek istediğimizi varsayalım. 500 seçmenden oluşan basit rastgele bir örneklem alıyoruz ve onlara siyasi parti tercihlerini soruyoruz. Aşağıdaki tabloda anketin sonuçları sunulmaktadır:
Cumhuriyetçi | Demokrat | Bağımsız | Toplam | |
Erkek | 120 | 90 | 40 | 250 |
Dişi | 110 | 95 | 45 | 250 |
Toplam | 230 | 185 | 85 | 500 |
Cinsiyetin siyasi parti tercihiyle ilişkili olup olmadığını belirlemek amacıyla Python’da ki-kare bağımsızlık testi gerçekleştirmek için aşağıdaki adımları kullanın.
Adım 1: Verileri oluşturun.
Öncelikle verilerimizi tutacak bir tablo oluşturacağız:
data = [[120, 90, 40], [110, 95, 45]]
Adım 2: Ki-kare bağımsızlık testini uygulayın.
Daha sonra, aşağıdaki sözdizimini kullanan SciPy kütüphanesindeki chi2_contingency fonksiyonunu kullanarak ki-kare bağımsızlık testini gerçekleştirebiliriz:
chi2_contingency (gözlenen)
Altın:
- gözlemlenen: gözlemlenen değerlerin bir beklenmedik durum tablosu.
Aşağıdaki kod, bu işlevin özel örneğimizde nasıl kullanılacağını gösterir:
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
Sonucun yorumlanma şekli şu şekildedir:
- Ki-kare testi istatistiği: 0,864
- p değeri: 0,649
- Serbestlik derecesi: 2 (#satır-1 * #sütun-1 şeklinde hesaplanır)
- Tablo: Son tablo, beklenmedik durum tablosundaki her bir hücre için beklenen değerleri gösterir.
Ki-kare bağımsızlık testinin aşağıdaki boş ve alternatif hipotezleri kullandığını hatırlayın:
- H 0 : (sıfır hipotezi) İki değişken bağımsızdır.
- H 1 : (alternatif hipotez) İki değişken bağımsız değildir .
Testin p değeri (0,649) 0,05’ten az olmadığı için sıfır hipotezini reddedemiyoruz. Bu, cinsiyet ile siyasi parti tercihleri arasında bir ilişki olduğunu söyleyecek yeterli kanıta sahip olmadığımız anlamına geliyor.
Yani cinsiyet ve siyasi parti tercihleri bağımsızdır.