İstatistikte eşit varyans varsayımı nedir?
Birçok istatistiksel test eşit varyans varsayımını yapar. Bu varsayıma uyulmazsa test sonuçları güvenilmez hale gelir.
Bu eşit varyans varsayımını yapan en yaygın istatistiksel testler ve prosedürler şunları içerir:
1. ANOVA
2. t-testleri
3. Doğrusal regresyon
Bu eğitimde her test için yapılan varsayım, bu varsayımın karşılanıp karşılanmadığının nasıl belirleneceği ve ihlal edilmesi durumunda ne yapılacağı açıklanmaktadır.
ANOVA’da varyans eşitliği varsayımı
Üç veya daha fazla bağımsız grubun ortalamaları arasında anlamlı bir fark olup olmadığını belirlemek için ANOVA (“Varyans Analizi”) kullanılır.
ANOVA’yı ne zaman kullanabileceğimize dair bir örnek:
Diyelim ki bir kilo verme deneyine katılmak üzere 90 kişiyi işe aldık. Bir ay boyunca A, B veya C programını kullanmak üzere 30 kişiyi rastgele seçiyoruz.
Programın kilo kaybına etkisi olup olmadığını görmek için tek yönlü ANOVA yapabiliriz.
ANOVA, grupların her birinin eşit varyansa sahip olduğunu varsayar. Bu hipotezin doğru olup olmadığını test etmenin iki yolu vardır:
1. Kutu grafikleri oluşturun.
Kutu grafikleri, varyansların eşitliği varsayımını doğrulamak için görsel bir yol sağlar.
Her gruptaki kilo kaybındaki farklılık, her kutu grafiğinin uzunluğuna göre gözlemlenebilir. Kutu ne kadar uzun olursa, varyans da o kadar yüksek olur. Örneğin Program A ve Program B ile karşılaştırıldığında Program C katılımcıları için varyansın biraz daha yüksek olduğunu görebiliriz.
2. Bartlett testini gerçekleştirin.
Bartlett testi, örneklerin eşit varyansa sahip olduğunu ifade eden boş hipotezi, örneklerin eşit varyansa sahip olmadığı alternatif hipotezine karşı test eder.
Testin p değeri belirli bir anlamlılık düzeyinin (0,05 gibi) altındaysa, o zaman örneklerin hepsinin eşit varyansa sahip olmadığına dair kanıtımız olur.
Eşit varyans varsayımı karşılanmazsa ne olur?
Genel olarak ANOVA’ların, her grup aynı örneklem büyüklüğüne sahip olduğu sürece eşit varyans varsayımının ihlallerine karşı oldukça dayanıklı olduğu kabul edilir.
Ancak örneklem büyüklükleri aynı değilse ve bu varsayım ciddi şekilde ihlal ediliyorsa bunun yerine tek yönlü ANOVA’nın parametrik olmayan versiyonu olan Kruskal-Wallis testini çalıştırabilirsiniz.
T testlerinde eşit varyans varsayımı
İki örneklem t testi, iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılır.
Test, varyansların iki grup arasında eşit olduğunu varsayar. Bu hipotezin doğru olup olmadığını test etmenin iki yolu vardır:
1. Temel oran kuralını kullanın.
Genel olarak en büyük varyansın en küçük varyansa oranı 4’ten küçükse varyansların yaklaşık olarak eşit olduğunu varsayabilir ve iki örnekli t testini kullanabiliriz.
Örneğin, 1. numunenin varyansının 24.5 olduğunu ve 2. numunenin varyansının 15.2 olduğunu varsayalım. En büyük örnek varyansının en küçük örnek varyansına oranı şu şekilde hesaplanacaktır: 24,5 / 15,2 = 1,61.
Bu oranın 4’ten küçük olması nedeniyle iki grup arasındaki farkların yaklaşık olarak eşit olduğu varsayılabilir.
2. Bir F testi yapın.
F testi, örneklerin eşit varyansa sahip olduğunu belirten boş hipotezi, örneklerin eşit varyansa sahip olmadığı alternatif hipotezine karşı test eder.
Testin p değeri belirli bir anlamlılık düzeyinin (0,05 gibi) altındaysa, o zaman örneklerin hepsinin eşit varyansa sahip olmadığına dair kanıtımız olur.
Eşit varyans varsayımı karşılanmazsa ne olur?
Bu varsayım ihlal edilirse, iki örnekli t testinin parametrik olmayan bir versiyonu olan ve iki örneğin eşit varyansa sahip olduğunu varsaymayan Welch t testini uygulayabiliriz.
Doğrusal Regresyonda Eşit Varyans Varsayımı
Doğrusal regresyon, bir veya daha fazla öngörücü değişken ile bir yanıt değişkeni arasındaki ilişkiyi ölçmek için kullanılır.
Doğrusal regresyon, artıkların , yordayıcı değişken(ler)in her seviyesinde sabit varyansa sahip olduğunu varsayar. Buna homoskedastisite denir. Durum böyle olmadığında artıklar değişen varyans sorunu yaşar ve regresyon analizinin sonuçları güvenilmez hale gelir.
Bu varsayımın karşılanıp karşılanmadığını belirlemenin en yaygın yolu, artıkların uygun değerlere karşı grafiğini oluşturmaktır. Bu grafikteki artıklar sıfır etrafında rastgele dağılmış gibi görünüyorsa, bu durumda eş varyans varsayımı muhtemelen karşılanmaktadır.
Bununla birlikte, aşağıdaki grafikteki “koni” şekli gibi, artıklarda sistematik bir eğilim varsa, o zaman heteroskedastisite bir sorundur:
Eşit varyans varsayımı karşılanmazsa ne olur?
Bu varsayım ihlal edilirse sorunu çözmenin en yaygın yolu, yanıt değişkenini üç dönüşümden birini kullanarak dönüştürmektir:
1. Günlük dönüşümü: yanıt değişkenini y’den log(y)’ ye dönüştürün.
2. Karekök dönüşümü: Yanıt değişkenini y’den √y’ye dönüştürün.
3. Küp kök dönüşümü: yanıt değişkenini y’den y 1/3’e dönüştürün.
Bu dönüşümlerin gerçekleştirilmesiyle değişen varyans sorunu genel olarak ortadan kalkar.
Heteroskedasticity’yi düzeltmenin başka bir yolu da ağırlıklı en küçük kareler regresyonunu kullanmaktır. Bu regresyon türü, her veri noktasına, uydurulan değerin varyansına bağlı olarak bir ağırlık atar.
Temel olarak bu, daha yüksek varyansa sahip veri noktalarına düşük ağırlık vererek bunların kalan karelerini azaltır. Uygun ağırlıklar kullanıldığında değişen varyans sorunu ortadan kaldırılabilir.
Ek kaynaklar
ANOVA’da formüle edilen üç hipotez
T testinde formüle edilen dört hipotez
Doğrusal regresyonun dört varsayımı