İstatistikte normallik varsayımı nedir?
Birçok istatistiksel test normallik varsayımı olarak adlandırılan şeye dayanır.
Bu hipotez, bir popülasyondan çok sayıda bağımsız rastgele örnek toplarsak ve ilgilenilen bir değeri ( örnek ortalaması gibi) hesaplarsak, ardından örnek ortalamalarının dağılımını görselleştirmek için bir histogram oluşturursak, mükemmel bir çan eğrisi gözlemlememiz gerektiğini belirtir.
Aşağıdakiler de dahil olmak üzere birçok istatistiksel teknik verilerle ilgili bu varsayımı yapar:
1. Tek örnek t testi : Örnek verilerin normal dağıldığı varsayılır.
2. İki örnekli t testi : İki örneğin normal dağıldığı varsayılmaktadır.
3. ANOVA : Model artıklarının normal dağıldığı varsayılmaktadır.
4. Doğrusal regresyon : Model artıklarının normal dağıldığı varsayılmaktadır.
Bu varsayım karşılanmazsa, bu testlerin sonuçları güvenilmez hale gelir ve veri örneklerinden elde ettiğimiz sonuçları genel popülasyona güvenle genelleştiremeyiz. Bu nedenle bu hipotezin karşılanıp karşılanmadığını kontrol etmek önemlidir.
Bu normallik varsayımının karşılanıp karşılanmadığını kontrol etmenin iki yaygın yolu vardır:
1. Normalliği görselleştirin
2. Resmi bir istatistiksel test yapın
Aşağıdaki bölümlerde oluşturabileceğiniz belirli grafikler ve normalliği kontrol etmek için gerçekleştirebileceğiniz belirli istatistiksel testler açıklanmaktadır.
Normalliği görselleştirin
Bir veri kümesinin normal şekilde dağılıp dağılmadığını kontrol etmenin hızlı ve resmi olmayan bir yolu, bir histogram veya QQ grafiği oluşturmaktır.
1. Histogram
Bir veri kümesinin histogramı kabaca çan şeklindeyse, verilerin normal şekilde dağılması muhtemeldir.
2.QQLand
QQ grafiği, “yüzdelik-yüzdelik” kelimesinin kısaltmasıdır, x ekseni boyunca teorik yüzdelik dilimleri (yani, normal bir dağılım izleseydi verilerinizin olacağı yer) ve y ekseni boyunca örneklerin yüzdelik dilimlerini görüntüleyen bir grafik türüdür. (yani verilerinizin gerçekte bulunduğu yer).
Veri değerleri 45 derecelik bir açı oluşturan kabaca düz bir çizgi izliyorsa verilerin normal dağıldığı varsayılır.
Resmi bir istatistiksel test gerçekleştirin
Bir veri kümesinin normal şekilde dağılıp dağılmadığını belirlemek için resmi bir istatistiksel test de yapabilirsiniz.
Testin p değeri belirli bir anlamlılık düzeyinin altındaysa (α = 0,05 gibi), bu durumda verilerin normal dağılmadığını söylemek için yeterli kanıtınız vardır.
Normalliği test etmek için yaygın olarak kullanılan üç istatistiksel test vardır:
1. Jarque-Bera testi
- Excel’de Jarque-Bera Testi Nasıl Gerçekleştirilir
- R’de Jarque-Bera testi nasıl yapılır
- Python’da Jarque-Bera testi nasıl yapılır
2. Shapiro-Wilk testi
3. Kolmogorov-Smirnov testi
- Excel’de Kolmogorov-Smirnov Testi Nasıl Yapılır
- R’de Kolmogorov-Smirnov testi nasıl yapılır?
- Python’da Kolmogorov-Smirnov testi nasıl yapılır?
Normallik varsayımı ihlal edilirse ne yapılmalı?
Verilerinizin normal şekilde dağılmadığı ortaya çıkarsa iki seçeneğiniz vardır:
1. Verileri dönüştürün.
Bir seçenek, verileri daha normal bir şekilde dağıtılacak şekilde dönüştürmektir . Yaygın dönüşümler şunları içerir:
- Günlük Dönüşümü: Verileri y’den log(y)’ ye dönüştürün.
- Karekök dönüşümü: verileri y’den √y’ye dönüştürün
- Küp kök dönüşümü: Verileri y’den y 1/3’e dönüştürün
- Box-Cox Dönüşümü: Box-Cox prosedürünü kullanarak verileri dönüştürün
Bu dönüşümlerin gerçekleştirilmesiyle veri değerlerinin dağılımı genel olarak daha normal dağılmış hale gelir.
2. Parametrik olmayan bir test gerçekleştirin
Normallik varsayımını yapan istatistiksel testlere parametrik testler denir. Ancak bu normallik varsayımını yerine getirmeyen , parametrik olmayan testler olarak adlandırılan bir aile de vardır.
Verilerinizin normal şekilde dağılmadığı ortaya çıkarsa parametrik olmayan bir test yapabilirsiniz. Yaygın istatistiksel testlerin parametrik olmayan bazı versiyonları şunlardır:
Parametrik test | Parametrik olmayan eşdeğer |
---|---|
Örnek bir t testi | Örnek bir Wilcoxon imzalı sıralama testi |
İki örnekli t testi | Mann-Whitney U testi |
Eşleştirilmiş örnekler t testi | Wilcoxon imzalı sıralama testinin iki örneği |
Tek yönlü ANOVA | Kruskal-Wallis testi |
Bu parametrik olmayan testlerin her biri, normallik varsayımını karşılamadan istatistiksel bir testin yürütülmesini mümkün kılar.
Ek kaynaklar
T testinde formüle edilen dört hipotez
Doğrusal regresyonun dört varsayımı
ANOVA’nın dört hipotezi