Sas'ta breusch-pagan testi nasıl yapılır
Bir regresyon analizinde değişen varyansın mevcut olup olmadığını belirlemek için Breusch-Pagan testi kullanılır.
Bu eğitimde SAS’ta Breusch-Pagan testinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: SAS’ta Breusch-Pagan testi
Öğrencilerin final sınavı notunu tahmin etmek için ders çalışmak için harcanan saat sayısını ve alınan uygulama sınavlarının sayısını kullanan çoklu doğrusal regresyon modelini uyarlamak istediğimizi varsayalım:
Sınav puanı = β 0 + β 1 (saat) + β 2 (hazırlık sınavları)
Öncelikle 20 öğrenciye yönelik bu bilgileri içeren bir veri seti oluşturmak için aşağıdaki kodu kullanacağız:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
Daha sonra, bu çoklu doğrusal regresyon modeline uymak için proc modelini ve ayrıca değişen varyans için Breusch-Pagan testini gerçekleştirmek için pagan ifadesini kullanacağız:
/*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
parms a1 b1 b2;
score = a1 + b1*hours + b2*prep_exams;
fit score / pagan=(1 hours prep_exams)
out =resid1 outsid ;
run ;
quit ;
Son sonuç tablosu Breusch-Pagan testinin sonuçlarını göstermektedir.
Bu tablodan test istatistiğinin 5,05 ve karşılık gelen p değerinin 0,0803 olduğunu görebiliriz.
P değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz.
Bu, regresyon modelinde değişen varyansın mevcut olduğunu iddia etmek için yeterli kanıta sahip olmadığımız anlamına gelir.
Bu nedenle regresyon özet tablosundaki katsayı tahminlerinin standart hatalarını güvenli bir şekilde yorumlamak mümkündür.
Sonra ne yapacağız
Breusch-Pagan testinin sıfır hipotezini reddetmezseniz, bu durumda heteroskedastisite mevcut değildir ve orijinal regresyonun sonucunu yorumlamaya devam edebilirsiniz.
Ancak sıfır hipotezini reddederseniz bu, verilerde heteroskedastisitenin mevcut olduğu anlamına gelir. Bu durumda regresyon çıktı tablosunda görüntülenen standart hatalar güvenilir olmayabilir.
Bu sorunu çözmenin birkaç yaygın yolu vardır:
1. Yanıt değişkenini dönüştürün. Yanıt değişkeni üzerinde bir dönüşüm gerçekleştirmeyi deneyebilirsiniz.
Örneğin, orijinal yanıt değişkeni yerine günlük yanıt değişkenini kullanabilirsiniz.
Genel olarak yanıt değişkeninin logunun alınması değişen varyanslılığı ortadan kaldırmanın etkili bir yoludur.
Diğer bir yaygın dönüşüm, yanıt değişkeninin karekökünün kullanılmasıdır.
2. Ağırlıklı regresyon kullanın. Bu regresyon türü, her veri noktasına, uydurulan değerin varyansına bağlı olarak bir ağırlık atar.
Bu, daha yüksek varyansa sahip veri noktalarına küçük ağırlıklar vererek bunların kalan karelerini azaltır.
Uygun ağırlıklar kullanıldığında değişen varyans sorunu ortadan kaldırılabilir.