White'ın testi sas'ta nasıl gerçekleştirilir?
White testi, bir regresyon modelinde değişen varyansın mevcut olup olmadığını belirlemek için kullanılır.
Değişken varyans, bir regresyon modelinde bir yanıt değişkeninin farklı seviyelerindeki artıkların eşit olmayan dağılımını ifade eder; bu,doğrusal regresyonun, artıkların yanıt değişkeninin her düzeyinde eşit şekilde dağıldığı yönündeki temel varsayımlarından birini ihlal eder.
Bu eğitimde, belirli bir regresyon modelinde heteroskedastisitenin bir sorun olup olmadığını belirlemek için SAS’ta White testinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: SAS’ta beyaz testi
Öğrencilerin final sınavı notunu tahmin etmek için ders çalışmak için harcanan saat sayısını ve alınan uygulama sınavlarının sayısını kullanan çoklu doğrusal regresyon modelini uyarlamak istediğimizi varsayalım:
Sınav puanı = β 0 + β 1 (saat) + β 2 (hazırlık sınavları)
Öncelikle 20 öğrenciye yönelik bu bilgileri içeren bir veri seti oluşturmak için aşağıdaki kodu kullanacağız:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
Daha sonra, bu çoklu doğrusal regresyon modeline uyum sağlamak için proc reg’in yanı sıra White’ın değişen varyans testini gerçekleştirmek için spec seçeneğini kullanacağız:
/*fit regression model and perform White's test*/
proc reg data =exam_data;
model score = hours prep_exams / spec ;
run ;
quit ;
Son sonuç tablosu White’ın testinin sonuçlarını gösterir.
Bu tablodan Ki-kare test istatistiğinin 3,54 ve buna karşılık gelen p değerinin 0,6175 olduğunu görebiliriz.
White testi aşağıdaki boş ve alternatif hipotezleri kullanır:
- Boş (H 0 ) : Değişken varyans mevcut değil.
- Alternatif ( HA ): Değişken varyans mevcut.
P değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz.
Bu, regresyon modelinde değişen varyansın mevcut olduğunu iddia etmek için yeterli kanıta sahip olmadığımız anlamına gelir.
Bu nedenle regresyon özet tablosundaki katsayı tahminlerinin standart hatalarını güvenli bir şekilde yorumlamak mümkündür.
Sonra ne yapacağız
White testinin sıfır hipotezini reddetmeyi başaramazsanız, o zaman değişen varyans mevcut değildir ve orijinal regresyonun sonucunu yorumlamaya devam edebilirsiniz.
Ancak sıfır hipotezini reddederseniz bu, verilerde heteroskedastisitenin mevcut olduğu anlamına gelir. Bu durumda regresyon çıktı tablosunda görüntülenen standart hatalar güvenilir olmayabilir.
Bu sorunu çözmenin birkaç yaygın yolu vardır:
1. Yanıt değişkenini dönüştürün. Yanıt değişkeni üzerinde bir dönüşüm gerçekleştirmeyi deneyebilirsiniz.
Örneğin, orijinal yanıt değişkeni yerine günlük yanıt değişkenini kullanabilirsiniz.
Genel olarak yanıt değişkeninin logunun alınması, değişen varyansın ortadan kaldırılmasının etkili bir yoludur.
Diğer bir yaygın dönüşüm, yanıt değişkeninin karekökünün kullanılmasıdır.
2. Ağırlıklı regresyon kullanın. Bu regresyon türü, her veri noktasına, uydurulan değerin varyansına bağlı olarak bir ağırlık atar.
Bu, daha yüksek varyansa sahip veri noktalarına küçük ağırlıklar vererek bunların kalan karelerini azaltır.
Uygun ağırlıklar kullanıldığında değişen varyans sorunu ortadan kaldırılabilir.