Uyum iyiliği g testi: tanım + örnek
İstatistikte, kategorik bir değişkenin varsayımsal bir dağılıma uyup uymadığını belirlemek için uyum iyiliği için G testi kullanılır.
Bu test , ki-kare uyum iyiliği testinin bir alternatifidir ve genellikle verilerde aykırı değerler mevcut olduğunda veya üzerinde çalıştığınız veriler aşırı büyük olduğunda kullanılır.
G-Uyum iyiliği Testi aşağıdaki boş ve alternatif hipotezleri kullanır:
- H 0 : Bir değişken varsayımsal bir dağılım izler.
- H A : Bir değişken varsayımsal bir dağılım izlemez .
Test istatistiği şu şekilde hesaplanır:
G=2 * Σ[O * ln(O/E)]
Altın:
- O: Bir hücrede gözlenen sayı
- E: Bir hücrede beklenen sayı
Test istatistiğine karşılık gelen p değeri belirli bir anlamlılık düzeyinin altındaysa, boş hipotezi reddedebilir ve incelenen değişkenin varsayılan dağılıma uymadığı sonucuna varabilirsiniz.
Aşağıdaki örnek, uyum iyiliği G testinin pratikte nasıl gerçekleştirileceğini göstermektedir.
Örnek: Uyum iyiliğinin G testi
Bir biyolog, belirli bir bölgede eşit oranda üç kaplumbağa türünün bulunduğunu iddia ediyor. Bu iddiayı test etmek için bağımsız bir araştırmacı, her tür türünün sayısını sayar ve aşağıdakileri bulur:
- Tür A: 80
- Tür B: 125
- Tür C: 95
Bağımsız araştırmacı, topladığı verilerin biyoloğun iddialarıyla tutarlı olup olmadığını belirlemek amacıyla uyum iyiliği G testi gerçekleştirmek için aşağıdaki adımları kullanabilir.
Adım 1: Boş ve alternatif hipotezleri belirtin.
Araştırmacı aşağıdaki varsayımları kullanarak uyum iyiliğine ilişkin G testini gerçekleştirecektir:
- H 0 : Bu alanda eşit oranda üç kaplumbağa türü bulunmaktadır.
- H A : Bu alanda eşit oranda üç kaplumbağa türü bulunmamaktadır .
Adım 2: Test istatistiğini hesaplayın.
Test istatistiğini hesaplama formülü şöyledir:
G=2 * Σ[O * ln(O/E)]
Bu örnekte toplam 300 kaplumbağa gözlemlenmektedir. Her türden eşit oranda olsaydı, her türden 100 kaplumbağayı gözlemlemeyi beklerdik. Yani test istatistiğini şu şekilde hesaplayabiliriz:
G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337
Adım 3: Test istatistiğinin p değerini hesaplayın.
Ki-kare – P değeri hesaplayıcısına göre, 10,337 test istatistiği ve #categories-1 = 3-1 = 2 serbestlik derecesi ile ilişkili p değeri 0,005693’tür .
Bu p değeri 0,05’ten küçük olduğundan araştırmacı sıfır hipotezini reddedecektir. Bu, söz konusu bölgede her kaplumbağa türünün eşit oranda bulunmadığını söyleyecek yeterli kanıta sahip olduğu anlamına geliyor.
Bonus: R’de uyum iyiliği için G testi
R’de hızlı bir şekilde uyum iyiliği G testi gerçekleştirmek için DescTools paketindeki Gtest() işlevini kullanabilirsiniz.
Aşağıdaki kod, önceki örnek için G testinin nasıl gerçekleştirileceğini gösterir:
#load the DescTools library library (DescTools) #perform the G-test GTest(x = c(80, 125, 95), #observed values p = c(1/3, 1/3, 1/3), #expected proportions correct=" none ") Log likelihood ratio (G-test) goodness of fit test data: c(80, 125, 95) G = 10.337, X-squared df = 2, p-value = 0.005693
G testi istatistiğinin 10,337 ve karşılık gelen p değerinin 0,005693 olduğunu unutmayın. Bu p değeri 0,05’ten küçük olduğundan sıfır hipotezini reddederiz.
Bu, manuel olarak hesapladığımız sonuçlarla eşleşiyor.
Ek kaynaklar
Herhangi bir veri seti için otomatik olarak bir G testi gerçekleştirmek üzere bu uyum iyiliği G testi hesaplayıcısını kullanmaktan çekinmeyin.