Uyum iyiliği g testi: tanım + örnek


İstatistikte, kategorik bir değişkenin varsayımsal bir dağılıma uyup uymadığını belirlemek için uyum iyiliği için G testi kullanılır.

Bu test , ki-kare uyum iyiliği testinin bir alternatifidir ve genellikle verilerde aykırı değerler mevcut olduğunda veya üzerinde çalıştığınız veriler aşırı büyük olduğunda kullanılır.

G-Uyum iyiliği Testi aşağıdaki boş ve alternatif hipotezleri kullanır:

  • H 0 : Bir değişken varsayımsal bir dağılım izler.
  • H A : Bir değişken varsayımsal bir dağılım izlemez .

Test istatistiği şu şekilde hesaplanır:

G=2 * Σ[O * ln(O/E)]

Altın:

  • O: Bir hücrede gözlenen sayı
  • E: Bir hücrede beklenen sayı

Test istatistiğine karşılık gelen p değeri belirli bir anlamlılık düzeyinin altındaysa, boş hipotezi reddedebilir ve incelenen değişkenin varsayılan dağılıma uymadığı sonucuna varabilirsiniz.

Aşağıdaki örnek, uyum iyiliği G testinin pratikte nasıl gerçekleştirileceğini göstermektedir.

Örnek: Uyum iyiliğinin G testi

Bir biyolog, belirli bir bölgede eşit oranda üç kaplumbağa türünün bulunduğunu iddia ediyor. Bu iddiayı test etmek için bağımsız bir araştırmacı, her tür türünün sayısını sayar ve aşağıdakileri bulur:

  • Tür A: 80
  • Tür B: 125
  • Tür C: 95

Bağımsız araştırmacı, topladığı verilerin biyoloğun iddialarıyla tutarlı olup olmadığını belirlemek amacıyla uyum iyiliği G testi gerçekleştirmek için aşağıdaki adımları kullanabilir.

Adım 1: Boş ve alternatif hipotezleri belirtin.

Araştırmacı aşağıdaki varsayımları kullanarak uyum iyiliğine ilişkin G testini gerçekleştirecektir:

  • H 0 : Bu alanda eşit oranda üç kaplumbağa türü bulunmaktadır.
  • H A : Bu alanda eşit oranda üç kaplumbağa türü bulunmamaktadır .

Adım 2: Test istatistiğini hesaplayın.

Test istatistiğini hesaplama formülü şöyledir:

G=2 * Σ[O * ln(O/E)]

Bu örnekte toplam 300 kaplumbağa gözlemlenmektedir. Her türden eşit oranda olsaydı, her türden 100 kaplumbağayı gözlemlemeyi beklerdik. Yani test istatistiğini şu şekilde hesaplayabiliriz:

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337

Adım 3: Test istatistiğinin p değerini hesaplayın.

Ki-kare – P değeri hesaplayıcısına göre, 10,337 test istatistiği ve #categories-1 = 3-1 = 2 serbestlik derecesi ile ilişkili p değeri 0,005693’tür .

Bu p değeri 0,05’ten küçük olduğundan araştırmacı sıfır hipotezini reddedecektir. Bu, söz konusu bölgede her kaplumbağa türünün eşit oranda bulunmadığını söyleyecek yeterli kanıta sahip olduğu anlamına geliyor.

Bonus: R’de uyum iyiliği için G testi

R’de hızlı bir şekilde uyum iyiliği G testi gerçekleştirmek için DescTools paketindeki Gtest() işlevini kullanabilirsiniz.

Aşağıdaki kod, önceki örnek için G testinin nasıl gerçekleştirileceğini gösterir:

 #load the DescTools library
library (DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct=" none ")

	Log likelihood ratio (G-test) goodness of fit test

data: c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

G testi istatistiğinin 10,337 ve karşılık gelen p değerinin 0,005693 olduğunu unutmayın. Bu p değeri 0,05’ten küçük olduğundan sıfır hipotezini reddederiz.

Bu, manuel olarak hesapladığımız sonuçlarla eşleşiyor.

Ek kaynaklar

Herhangi bir veri seti için otomatik olarak bir G testi gerçekleştirmek üzere bu uyum iyiliği G testi hesaplayıcısını kullanmaktan çekinmeyin.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir