Python'da ki-kare uyum iyiliği testi nasıl yapılır
Kategorik bir değişkenin varsayımsal bir dağılıma uyup uymadığını belirlemek için ki -kare uyum iyiliği testi kullanılır.
Bu eğitimde Python’da ki-kare uyum iyiliği testinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: Python’da ki-kare uyum iyiliği testi
Bir mağaza sahibi, haftanın her günü mağazasına eşit sayıda müşterinin geldiğini söylüyor. Bu hipotezi test etmek için bir araştırmacı belirli bir haftada mağazaya gelen müşteri sayısını kaydeder ve aşağıdakileri bulur:
- Pazartesi: 50 müşteri
- Salı: 60 müşteri
- Çarşamba: 40 müşteri
- Perşembe: 47 müşteri
- Cuma: 53 müşteri
Verilerin mağaza sahibinin iddiasıyla tutarlı olup olmadığını belirlemek amacıyla Python’da ki-kare uyum iyiliği testi gerçekleştirmek için aşağıdaki adımları kullanın.
Adım 1: Verileri oluşturun.
İlk olarak, her gün için gözlemlenen ve beklenen müşteri sayısını içeren iki tablo oluşturacağız:
expected = [50, 50, 50, 50, 50] observed = [50, 60, 40, 47, 53]
Adım 2: Ki-kare uyum iyiliği testini gerçekleştirin.
Daha sonra, aşağıdaki sözdizimini kullanan SciPy kütüphanesindeki ki-kare fonksiyonunu kullanarak ki- kare uyum iyiliği testini gerçekleştirebiliriz:
ki kare (f_obs, f_exp)
Altın:
- f_obs: gözlemlenen sayımların bir dizisi.
- f_exp: beklenen sayıların bir dizisi. Varsayılan olarak her kategorinin eşit olasılığa sahip olduğu varsayılır.
Aşağıdaki kod, bu işlevin özel örneğimizde nasıl kullanılacağını gösterir:
import scipy.stats as stats #perform Chi-Square Goodness of Fit Test stats.chisquare(f_obs=observed, f_exp=expected) (statistic=4.36, pvalue=0.35947)
Ki-kare test istatistiği 4,36 ve buna karşılık gelen p değeri 0,35947’dir .
P değerinin, n-1 serbestlik derecesine (dof) sahip bir Ki-kare değerine karşılık geldiğine dikkat edin; burada n, farklı kategorilerin sayısıdır. Bu durumda dof = 5-1 = 4. Dof = 4 ile X 2 = 4,36’ya karşılık gelen p değerinin 0,35947 olduğunu doğrulamak için ki-kare – P değeri hesaplayıcısını kullanabilirsiniz.
Ki-kare uyum iyiliği testinin aşağıdaki boş ve alternatif hipotezleri kullandığını hatırlayın:
- H 0 : (sıfır hipotezi) Bir değişken varsayımsal bir dağılım izler.
- H 1 : (alternatif hipotez) Bir değişken varsayımsal bir dağılım izlemez.
P değeri (0,35947) 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Bu, müşterilerin gerçek dağılımının mağaza sahibinin bildirdiğinden farklı olduğunu söyleyecek yeterli kanıtımız olmadığı anlamına geliyor.