Stata'da kruskal-wallis testi nasıl yapılır?


Üç veya daha fazla bağımsız grubun medyanları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için Kruskal-Wallis testi kullanılır. Tek yönlü ANOVA’nın parametrik olmayan eşdeğeri olarak kabul edilir.

Bu eğitimde Stata’da Kruskal-Wallis testinin nasıl gerçekleştirileceği açıklanmaktadır.

Stata’da Kruskal-Wallis testi nasıl yapılır?

Bu örnek için, Amerika Birleşik Devletleri’ndeki elli eyaletin tamamı için 1980 nüfus sayımı verilerini içeren Census veri kümesini kullanacağız. Veri setinde eyaletler dört farklı bölgeye ayrılmıştır:

  • Kuzey Doğu
  • Kuzey Merkez
  • Güney
  • Batı

Bu dört bölgede ortanca yaşın eşit olup olmadığını belirlemek için Kruskal-Wallis testi yapacağız.

Adım 1: Verileri yükleyin ve görüntüleyin.

Öncelikle Komut kutusuna aşağıdaki komutu yazarak veri kümesini yükleyin:

https://www.stata-press.com/data/r13/census adresini kullanın

Aşağıdaki komutu kullanarak veri kümesinin hızlı bir özetini alın:

özetlemek

Stata'da bir veri kümesini özetleme

Bu veri setinde 13 farklı değişkenin olduğunu görebiliyoruz ancak çalışacağımız sadece ikisi medage (ortanca yaş) ve bölgedir .

Adım 2: Verileri görselleştirin.

Kruskal-Wallis testini gerçekleştirmeden önce, dört bölgenin her biri için medyan yaş dağılımını görselleştirmek üzere bazı kutu grafikleri oluşturalım :

medage grafik kutusu, (bölge)

Stata'da tek bir grafikte birden fazla kutu grafiği

Sadece kutu grafiklerine baktığınızda dağılımların bölgeden bölgeye farklılık gösterdiğini görebilirsiniz. Daha sonra bu farklılıkların istatistiksel olarak anlamlı olup olmadığını görmek için Kruskal-Wallis testi yapacağız.

Adım 3: Kruskal-Wallis testi yapın.

Kruskal-Wallis testi gerçekleştirmek için aşağıdaki sözdizimini kullanın:

kwallis ölçü_değişkeni, (grouping_variable) ile

Bizim durumumuzda aşağıdaki sözdizimini kullanacağız:

kwallis medage, (bölgeye) göre

Kruskal-Wallis'in Stata'ya çıkışı

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

Özet tablo: Bu tablo, bölge başına gözlem sayısını ve her bölge için sıralama toplamlarını gösterir.

Bağlı ki-kare: Test istatistiğinin değeri olup 17.062 olarak ortaya çıkar.

olasılık: Bu, test istatistiğine karşılık gelen ve 0,0007 olarak ortaya çıkan p değeridir. Bu değer 0,05’ten küçük olduğundan sıfır hipotezini reddedebilir ve ortanca yaşın dört bölgede eşit olmadığı sonucuna varabiliriz.

Adım 4: Sonuçları rapor edin.

Son olarak Kruskal-Wallis testinin sonuçlarını bildirmek istiyoruz. İşte bunun nasıl yapılacağına dair bir örnek:

Amerika Birleşik Devletleri’nin aşağıdaki dört bölgesinde bireylerin ortalama yaşının aynı olup olmadığını belirlemek için Kruskal-Wallist testi yapıldı:

  • Kuzeydoğu (n=9)
  • Kuzey Merkez (n=12)
  • Güney (n=16)
  • Batı (n=13)

Test, bireylerin ortanca yaşının dört bölgede aynı olmadığını (X 2 = 17,062, p = 0,0007) ortaya çıkardı. Yani iki veya daha fazla bölge arasında ortanca yaş açısından istatistiksel olarak anlamlı bir fark vardı.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir