İstatistikte normallik varsayımı nedir?


Birçok istatistiksel test normallik varsayımı olarak adlandırılan şeye dayanır.

Bu hipotez, bir popülasyondan çok sayıda bağımsız rastgele örnek toplarsak ve ilgilenilen bir değeri ( örnek ortalaması gibi) hesaplarsak, ardından örnek ortalamalarının dağılımını görselleştirmek için bir histogram oluşturursak, mükemmel bir çan eğrisi gözlemlememiz gerektiğini belirtir.

Aşağıdakiler de dahil olmak üzere birçok istatistiksel teknik verilerle ilgili bu varsayımı yapar:

1. Tek örnek t testi : Örnek verilerin normal dağıldığı varsayılır.

2. İki örnekli t testi : İki örneğin normal dağıldığı varsayılmaktadır.

3. ANOVA : Model artıklarının normal dağıldığı varsayılmaktadır.

4. Doğrusal regresyon : Model artıklarının normal dağıldığı varsayılmaktadır.

Bu varsayım karşılanmazsa, bu testlerin sonuçları güvenilmez hale gelir ve veri örneklerinden elde ettiğimiz sonuçları genel popülasyona güvenle genelleştiremeyiz. Bu nedenle bu hipotezin karşılanıp karşılanmadığını kontrol etmek önemlidir.

Bu normallik varsayımının karşılanıp karşılanmadığını kontrol etmenin iki yaygın yolu vardır:

1. Normalliği görselleştirin

2. Resmi bir istatistiksel test yapın

Aşağıdaki bölümlerde oluşturabileceğiniz belirli grafikler ve normalliği kontrol etmek için gerçekleştirebileceğiniz belirli istatistiksel testler açıklanmaktadır.

Normalliği görselleştirin

Bir veri kümesinin normal şekilde dağılıp dağılmadığını kontrol etmenin hızlı ve resmi olmayan bir yolu, bir histogram veya QQ grafiği oluşturmaktır.

1. Histogram

Bir veri kümesinin histogramı kabaca çan şeklindeyse, verilerin normal şekilde dağılması muhtemeldir.

2.QQLand

QQ grafiği, “yüzdelik-yüzdelik” kelimesinin kısaltmasıdır, x ekseni boyunca teorik yüzdelik dilimleri (yani, normal bir dağılım izleseydi verilerinizin olacağı yer) ve y ekseni boyunca örneklerin yüzdelik dilimlerini görüntüleyen bir grafik türüdür. (yani verilerinizin gerçekte bulunduğu yer).

Veri değerleri 45 derecelik bir açı oluşturan kabaca düz bir çizgi izliyorsa verilerin normal dağıldığı varsayılır.

Resmi bir istatistiksel test gerçekleştirin

Bir veri kümesinin normal şekilde dağılıp dağılmadığını belirlemek için resmi bir istatistiksel test de yapabilirsiniz.

Testin p değeri belirli bir anlamlılık düzeyinin altındaysa (α = 0,05 gibi), bu durumda verilerin normal dağılmadığını söylemek için yeterli kanıtınız vardır.

Normalliği test etmek için yaygın olarak kullanılan üç istatistiksel test vardır:

1. Jarque-Bera testi

2. Shapiro-Wilk testi

3. Kolmogorov-Smirnov testi

Normallik varsayımı ihlal edilirse ne yapılmalı?

Verilerinizin normal şekilde dağılmadığı ortaya çıkarsa iki seçeneğiniz vardır:

1. Verileri dönüştürün.

Bir seçenek, verileri daha normal bir şekilde dağıtılacak şekilde dönüştürmektir . Yaygın dönüşümler şunları içerir:

  • Günlük Dönüşümü: Verileri y’den log(y)’ ye dönüştürün.
  • Karekök dönüşümü: verileri y’den √y’ye dönüştürün
  • Küp kök dönüşümü: Verileri y’den y 1/3’e dönüştürün
  • Box-Cox Dönüşümü: Box-Cox prosedürünü kullanarak verileri dönüştürün

Bu dönüşümlerin gerçekleştirilmesiyle veri değerlerinin dağılımı genel olarak daha normal dağılmış hale gelir.

2. Parametrik olmayan bir test gerçekleştirin

Normallik varsayımını yapan istatistiksel testlere parametrik testler denir. Ancak bu normallik varsayımını yerine getirmeyen , parametrik olmayan testler olarak adlandırılan bir aile de vardır.

Verilerinizin normal şekilde dağılmadığı ortaya çıkarsa parametrik olmayan bir test yapabilirsiniz. Yaygın istatistiksel testlerin parametrik olmayan bazı versiyonları şunlardır:

Parametrik test Parametrik olmayan eşdeğer
Örnek bir t testi Örnek bir Wilcoxon imzalı sıralama testi
İki örnekli t testi Mann-Whitney U testi
Eşleştirilmiş örnekler t testi Wilcoxon imzalı sıralama testinin iki örneği
Tek yönlü ANOVA Kruskal-Wallis testi

Bu parametrik olmayan testlerin her biri, normallik varsayımını karşılamadan istatistiksel bir testin yürütülmesini mümkün kılar.

Ek kaynaklar

T testinde formüle edilen dört hipotez
Doğrusal regresyonun dört varsayımı
ANOVA’nın dört hipotezi

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir