Ölçek ve konum grafiği nasıl yorumlanır: örneklerle
Ölçeklendirilmiş konum grafiği, x ekseni boyunca bir regresyon modelinin uygun değerlerini ve y ekseni boyunca standartlaştırılmış artıkların karekökünü görüntüleyen bir grafik türüdür.
Bu grafiğe bakarak iki şeyi kontrol ediyoruz:
1. Kırmızı çizginin çizim üzerinde yaklaşık olarak yatay olduğunu doğrulayın. Eğer durum buysa, o zaman eş varyans varsayımı belirli bir regresyon modeli için muhtemelen karşılanır. Yani artıkların dağılımı tüm uygun değerler için yaklaşık olarak eşittir.
2. Artıklar arasında net bir trend olup olmadığını kontrol edin. Başka bir deyişle, artıklar, tüm uyum değerleri için yaklaşık olarak eşit değişkenlik ile kırmızı çizgi etrafında rastgele dağılmalıdır.
R’de ölçek ve konum çizimi
R’de basit bir doğrusal regresyon modelini sığdırmak ve ortaya çıkan model için bir ölçek ve konum grafiği oluşturmak için aşağıdaki kodu kullanabiliriz:
#fit simple linear regression model model <- lm(Ozone ~ Temp, data = airquality) #produce scale-location plot plot(model)
Bu regresyon modelinin ölçek-konum grafiğinden aşağıdaki iki şeyi gözlemleyebiliriz.
1. Kırmızı çizgi arsa üzerinde yaklaşık olarak yataydır. Eğer durum böyleyse, o zaman belirli bir regresyon modeli için eş varyans varsayımı karşılanır. Yani artıkların dağılımı tüm uygun değerler için yaklaşık olarak eşittir.
2. Artıklar arasında net bir trend olup olmadığını kontrol edin. Başka bir deyişle, artıklar, tüm uyum değerleri için yaklaşık olarak eşit değişkenlik ile kırmızı çizgi etrafında rastgele dağılmalıdır.
Teknik notlar
Veri kümesinden en yüksek standartlaştırılmış artıklara sahip üç gözlem grafikte etiketlenmiştir.
30, 62 ve 117. satırlardaki gözlemlerin en yüksek standartlaştırılmış artıklara sahip olduğunu görebiliriz.
Bu, bu gözlemlerin mutlaka aykırı değerler olduğu anlamına gelmez, ancak bu gözlemleri daha yakından incelemek için orijinal verilere bakmak isteyebilirsiniz.
Ölçek konum grafiğinde kırmızı çizginin kabaca yatay olduğunu görebilsek de, bu yalnızca eş varyans varsayımının karşılanıp karşılanmadığını görmenin görsel bir yolu olarak hizmet eder.
Eş varyans varsayımının karşılanıp karşılanmadığını görmek için kullanabileceğimiz resmi bir istatistiksel test Breusch-Pagan testidir .
R’de Breusch-Pagan testi
Aşağıdaki kod, R’de Breusch-Pagan testi gerçekleştirmek için lmtest paketinin bptest() işlevinin nasıl kullanılacağını gösterir:
#load lmtest package library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 1.4798, df = 1, p-value = 0.2238
Breusch-Pagan testi aşağıdaki boş ve alternatif hipotezleri kullanır:
- Sıfır hipotezi (H 0 ): artıklar aynı varyanslıdır (yani eşit dağılımlıdır)
- Alternatif hipotez ( HA ): Artıklar değişen varyanslıdır (yani düzgün dağılmamıştır)
Sonuçtan testin p değerinin 0,2238 olduğunu görebiliyoruz. Bu p değeri 0,05’ten küçük olmadığı için sıfır hipotezini reddedemiyoruz. Regresyon modelinde heteroskedastisitenin mevcut olduğunu iddia edecek yeterli kanıtımız yok.
Bu sonuç, ölçek-konum grafiğindeki kırmızı çizgiye ilişkin görsel incelememizle eşleşiyor.
Ek kaynaklar
Regresyon Analizinde Heteroskedastisiteyi Anlamak
R’de artık arsa nasıl oluşturulur
R’de Breusch-Pagan testi nasıl yapılır