Stata'da ki-kare uyum iyiliği testi nasıl yapılır?
Kategorik bir değişkenin varsayımsal bir dağılıma uyup uymadığını belirlemek için ki-kare uyum iyiliği testi kullanılır.
Bu eğitimde Stata’da ki-kare uyum iyiliği testinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: Stata’da ki-kare uyum iyiliği testi
Bu testin nasıl gerçekleştirileceğini göstermek için, 1988 yılında Amerika Birleşik Devletleri’nde kadınların çalışma istatistiklerine ilişkin bilgileri içeren nlsw88 adlı bir veri kümesini kullanacağız.
Bu veri setindeki ırkın gerçek dağılımının şu şekilde olup olmadığını belirlemek amacıyla ki-kare uyum iyiliği testi gerçekleştirmek için aşağıdaki adımları izleyin: %70 Beyaz, %20 Siyah, %10 Diğer.
Adım 1: Ham verileri yükleyin ve görüntüleyin.
Öncelikle aşağıdaki komutu yazarak verileri yükleyeceğiz:
nlsw88 sistemi
Aşağıdaki komutu yazarak ham verileri görüntüleyebiliriz:
br
Her satırda bir kişi hakkında yaş, ırk, medeni durum, eğitim düzeyi ve diğer çeşitli faktörler dahil olmak üzere bilgiler görüntülenir.
Adım 2: Ayarlama paketini yükleyin.
Uygunluk testi yapabilmek için csgof paketini kurmamız gerekecek. Bunu aşağıdaki komutu yazarak yapabiliriz:
csgof’u bul
Yeni bir pencere açılacaktır. https://stats.idre.ucla.edu/stat/stata/ado/analiz adresinden csgof yazan bağlantıya tıklayın.
Başka bir pencere görünecektir. Yüklemek için burayı tıklayın yazan bağlantıya tıklayın.
Paketin kurulması yalnızca birkaç saniye sürecektir.
Adım 3: Uygunluk testini gerçekleştirin.
Paket yüklendikten sonra, gerçek yarış dağılımının şu şekilde olup olmadığını belirlemek için veriler üzerinde uyum iyiliği testi yapabiliriz: %70 Beyaz, %20 Siyah, %10 Diğer.
Testi gerçekleştirmek için aşağıdaki sözdizimini kullanacağız:
csgof ilgi değişkeni, expperc(beklenen_yüzdelerin_listesi)
Bizim durumumuzda kullanacağımız sözdizimi tam olarak şöyle:
csgof, expperc(70, 20, 10) komutunu çalıştırın
Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:
Özet kutusu: Bu kutu bize her yarış için beklenen yüzdeyi, beklenen sıklığı ve gözlemlenen sıklığı gösterir. Örneğin:
- Beyaz bireylerin beklenen yüzdesi %70 idi. Bu bizim belirttiğimiz yüzdedir.
- Beyaz bireylerin beklenen sıklığı 1.572,2 idi. Bu, veri kümesinde 2.246 kişinin olduğu gerçeği kullanılarak hesaplanır, yani bu sayının %70’i 1.572,2’dir.
- Beyaz bireylerin gözlemlenen sıklığı 1.637 idi. Bu, veri kümesindeki beyaz bireylerin gerçek sayısıdır.
Chisq(2): Uyum iyiliği testi için Ki-kare test istatistiğidir. 218.13 olduğu ortaya çıktı.
p: Ki-kare testi istatistiğiyle ilişkili p değeridir. 0 olduğu ortaya çıkıyor. 0,05’ten küçük olduğundan, gerçek ırksal dağılımın %70 Beyaz, %20 Siyah ve %10 Diğerleri olduğuna ilişkin boş hipotezi reddetmekte başarısız oluyoruz. Gerçek ırksal dağılımın bu varsayımsal dağılımdan farklı olduğu sonucuna varmak için yeterli kanıtımız var.