Stata'da kruskal-wallis testi nasıl yapılır?
Üç veya daha fazla bağımsız grubun medyanları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için Kruskal-Wallis testi kullanılır. Tek yönlü ANOVA’nın parametrik olmayan eşdeğeri olarak kabul edilir.
Bu eğitimde Stata’da Kruskal-Wallis testinin nasıl gerçekleştirileceği açıklanmaktadır.
Stata’da Kruskal-Wallis testi nasıl yapılır?
Bu örnek için, Amerika Birleşik Devletleri’ndeki elli eyaletin tamamı için 1980 nüfus sayımı verilerini içeren Census veri kümesini kullanacağız. Veri setinde eyaletler dört farklı bölgeye ayrılmıştır:
- Kuzey Doğu
- Kuzey Merkez
- Güney
- Batı
Bu dört bölgede ortanca yaşın eşit olup olmadığını belirlemek için Kruskal-Wallis testi yapacağız.
Adım 1: Verileri yükleyin ve görüntüleyin.
Öncelikle Komut kutusuna aşağıdaki komutu yazarak veri kümesini yükleyin:
https://www.stata-press.com/data/r13/census adresini kullanın
Aşağıdaki komutu kullanarak veri kümesinin hızlı bir özetini alın:
özetlemek
Bu veri setinde 13 farklı değişkenin olduğunu görebiliyoruz ancak çalışacağımız sadece ikisi medage (ortanca yaş) ve bölgedir .
Adım 2: Verileri görselleştirin.
Kruskal-Wallis testini gerçekleştirmeden önce, dört bölgenin her biri için medyan yaş dağılımını görselleştirmek üzere bazı kutu grafikleri oluşturalım :
medage grafik kutusu, (bölge)
Sadece kutu grafiklerine baktığınızda dağılımların bölgeden bölgeye farklılık gösterdiğini görebilirsiniz. Daha sonra bu farklılıkların istatistiksel olarak anlamlı olup olmadığını görmek için Kruskal-Wallis testi yapacağız.
Adım 3: Kruskal-Wallis testi yapın.
Kruskal-Wallis testi gerçekleştirmek için aşağıdaki sözdizimini kullanın:
kwallis ölçü_değişkeni, (grouping_variable) ile
Bizim durumumuzda aşağıdaki sözdizimini kullanacağız:
kwallis medage, (bölgeye) göre
Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:
Özet tablo: Bu tablo, bölge başına gözlem sayısını ve her bölge için sıralama toplamlarını gösterir.
Bağlı ki-kare: Test istatistiğinin değeri olup 17.062 olarak ortaya çıkar.
olasılık: Bu, test istatistiğine karşılık gelen ve 0,0007 olarak ortaya çıkan p değeridir. Bu değer 0,05’ten küçük olduğundan sıfır hipotezini reddedebilir ve ortanca yaşın dört bölgede eşit olmadığı sonucuna varabiliriz.
Adım 4: Sonuçları rapor edin.
Son olarak Kruskal-Wallis testinin sonuçlarını bildirmek istiyoruz. İşte bunun nasıl yapılacağına dair bir örnek:
Amerika Birleşik Devletleri’nin aşağıdaki dört bölgesinde bireylerin ortalama yaşının aynı olup olmadığını belirlemek için Kruskal-Wallist testi yapıldı:
- Kuzeydoğu (n=9)
- Kuzey Merkez (n=12)
- Güney (n=16)
- Batı (n=13)
Test, bireylerin ortanca yaşının dört bölgede aynı olmadığını (X 2 = 17,062, p = 0,0007) ortaya çıkardı. Yani iki veya daha fazla bölge arasında ortanca yaş açısından istatistiksel olarak anlamlı bir fark vardı.