Ölçek ve konum grafiği nasıl yorumlanır: örneklerle


Ölçeklendirilmiş konum grafiği, x ekseni boyunca bir regresyon modelinin uygun değerlerini ve y ekseni boyunca standartlaştırılmış artıkların karekökünü görüntüleyen bir grafik türüdür.

Ölçeklendirilmiş konum grafiği

Bu grafiğe bakarak iki şeyi kontrol ediyoruz:

1. Kırmızı çizginin çizim üzerinde yaklaşık olarak yatay olduğunu doğrulayın. Eğer durum buysa, o zaman eş varyans varsayımı belirli bir regresyon modeli için muhtemelen karşılanır. Yani artıkların dağılımı tüm uygun değerler için yaklaşık olarak eşittir.

2. Artıklar arasında net bir trend olup olmadığını kontrol edin. Başka bir deyişle, artıklar, tüm uyum değerleri için yaklaşık olarak eşit değişkenlik ile kırmızı çizgi etrafında rastgele dağılmalıdır.

R’de ölçek ve konum çizimi

R’de basit bir doğrusal regresyon modelini sığdırmak ve ortaya çıkan model için bir ölçek ve konum grafiği oluşturmak için aşağıdaki kodu kullanabiliriz:

 #fit simple linear regression model
model <- lm(Ozone ~ Temp, data = airquality)

#produce scale-location plot
plot(model)

R'de Ölçek Konum Grafiği

Bu regresyon modelinin ölçek-konum grafiğinden aşağıdaki iki şeyi gözlemleyebiliriz.

1. Kırmızı çizgi arsa üzerinde yaklaşık olarak yataydır. Eğer durum böyleyse, o zaman belirli bir regresyon modeli için eş varyans varsayımı karşılanır. Yani artıkların dağılımı tüm uygun değerler için yaklaşık olarak eşittir.

2. Artıklar arasında net bir trend olup olmadığını kontrol edin. Başka bir deyişle, artıklar, tüm uyum değerleri için yaklaşık olarak eşit değişkenlik ile kırmızı çizgi etrafında rastgele dağılmalıdır.

Teknik notlar

Veri kümesinden en yüksek standartlaştırılmış artıklara sahip üç gözlem grafikte etiketlenmiştir.

30, 62 ve 117. satırlardaki gözlemlerin en yüksek standartlaştırılmış artıklara sahip olduğunu görebiliriz.

Bu, bu gözlemlerin mutlaka aykırı değerler olduğu anlamına gelmez, ancak bu gözlemleri daha yakından incelemek için orijinal verilere bakmak isteyebilirsiniz.

Ölçek konum grafiğinde kırmızı çizginin kabaca yatay olduğunu görebilsek de, bu yalnızca eş varyans varsayımının karşılanıp karşılanmadığını görmenin görsel bir yolu olarak hizmet eder.

Eş varyans varsayımının karşılanıp karşılanmadığını görmek için kullanabileceğimiz resmi bir istatistiksel test Breusch-Pagan testidir .

R’de Breusch-Pagan testi

Aşağıdaki kod, R’de Breusch-Pagan testi gerçekleştirmek için lmtest paketinin bptest() işlevinin nasıl kullanılacağını gösterir:

 #load lmtest package
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 1.4798, df = 1, p-value = 0.2238

Breusch-Pagan testi aşağıdaki boş ve alternatif hipotezleri kullanır:

  • Sıfır hipotezi (H 0 ): artıklar aynı varyanslıdır (yani eşit dağılımlıdır)
  • Alternatif hipotez ( HA ): Artıklar değişen varyanslıdır (yani düzgün dağılmamıştır)

Sonuçtan testin p değerinin 0,2238 olduğunu görebiliyoruz. Bu p değeri 0,05’ten küçük olmadığı için sıfır hipotezini reddedemiyoruz. Regresyon modelinde heteroskedastisitenin mevcut olduğunu iddia edecek yeterli kanıtımız yok.

Bu sonuç, ölçek-konum grafiğindeki kırmızı çizgiye ilişkin görsel incelememizle eşleşiyor.

Ek kaynaklar

Regresyon Analizinde Heteroskedastisiteyi Anlamak
R’de artık arsa nasıl oluşturulur
R’de Breusch-Pagan testi nasıl yapılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir