R'de ki-kare uyum iyiliği testi nasıl yapılır


Kategorik bir değişkenin varsayımsal bir dağılıma uyup uymadığını belirlemek için ki -kare uyum iyiliği testi kullanılır.

Bu eğitimde R’de ki-kare uyum iyiliği testinin nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: R’de ki-kare uyum iyiliği testi

Bir mağaza sahibi, haftanın her günü mağazasına eşit sayıda müşterinin geldiğini söylüyor. Bu hipotezi test etmek için bir araştırmacı belirli bir haftada mağazaya gelen müşteri sayısını kaydeder ve aşağıdakileri bulur:

  • Pazartesi: 50 müşteri
  • Salı: 60 müşteri
  • Çarşamba: 40 müşteri
  • Perşembe: 47 müşteri
  • Cuma: 53 müşteri

Verilerin mağaza sahibinin iddiasıyla tutarlı olup olmadığını belirlemek amacıyla R’de ki-kare uyum iyiliği testi gerçekleştirmek için aşağıdaki adımları izleyin.

Adım 1: Verileri oluşturun.

İlk olarak, gözlemlenen sıklıklarımızı ve her gün için beklenen müşteri oranımızı içeren iki tablo oluşturacağız:

 observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Adım 2: Ki-kare uyum iyiliği testini gerçekleştirin.

Daha sonra, aşağıdaki sözdizimini kullanan chisq.test() işlevini kullanarak ki-kare uyum testini gerçekleştirebiliriz:

chisq.test(x, p)

Altın:

  • x: Gözlemlenen frekansların sayısal bir vektörü.
  • p: Beklenen oranlarda sayısal bir vektör.

Aşağıdaki kod, örneğimizde bu işlevin nasıl kullanılacağını gösterir:

 #perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

	Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

Ki-kare test istatistiği 4,36 ve buna karşılık gelen p değeri 0,3595’tir .

P değerinin, n-1 serbestlik derecesine (dof) sahip bir Ki-kare değerine karşılık geldiğine dikkat edin; burada n, farklı kategorilerin sayısıdır. Bu durumda df = 5-1 = 4.

df = 4 ile X 2 = 4,36’ya karşılık gelen p değerinin 0,35947 olduğunu doğrulamak için ki-kare-P değeri hesaplayıcısını kullanabilirsiniz.

Ki-kare uyum iyiliği testinin aşağıdaki boş ve alternatif hipotezleri kullandığını hatırlayın:

  • H 0 : (sıfır hipotezi) Bir değişken varsayımsal bir dağılım izler.
  • H 1 : (alternatif hipotez) Bir değişken varsayımsal bir dağılım izlemez.

P değeri (0,35947) 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Bu, müşterilerin gerçek dağılımının mağaza sahibinin bildirdiğinden farklı olduğunu söyleyecek yeterli kanıtımız olmadığı anlamına geliyor.

Ek kaynaklar

R’de ki-kare bağımsızlık testi nasıl yapılır
R cinsinden ki-kare istatistiğinin P değeri nasıl hesaplanır?
R’de kritik ki kare değeri nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir