Cara menafsirkan plot skala dan lokasi: dengan contoh
Bagan lokasi berskala adalah jenis bagan yang menampilkan nilai pas model regresi di sepanjang sumbu x dan akar kuadrat dari residu standar di sepanjang sumbu y.
Melihat grafik ini, kami memeriksa dua hal:
1. Pastikan garis merah kira-kira horizontal pada plot. Jika hal ini terjadi, maka asumsi homoskedastisitas kemungkinan terpenuhi untuk model regresi tertentu. Artinya, distribusi residu kira-kira sama untuk semua nilai yang dipasang.
2. Periksa apakah tidak ada tren yang jelas di antara residu. Dengan kata lain, residu harus tersebar secara acak di sekitar garis merah dengan variabilitas yang kira-kira sama untuk semua nilai yang sesuai.
Plot skala dan lokasi di R
Kita dapat menggunakan kode berikut untuk menyesuaikan model regresi linier sederhana di R dan menghasilkan plot skala dan lokasi untuk model yang dihasilkan:
#fit simple linear regression model model <- lm(Ozone ~ Temp, data = airquality) #produce scale-location plot plot(model)
Dua hal berikut dapat kita amati dari plot skala-lokasi model regresi ini.
1. Garis merah kira-kira horizontal pada plot. Jika hal ini terjadi, maka asumsi homoskedastisitas terpenuhi untuk model regresi tertentu. Artinya, distribusi residu kira-kira sama untuk semua nilai yang dipasang.
2. Periksa apakah tidak ada tren yang jelas di antara residu. Dengan kata lain, residu harus tersebar secara acak di sekitar garis merah dengan variabilitas yang kira-kira sama untuk semua nilai yang sesuai.
Catatan teknis
Tiga observasi dari kumpulan data dengan residu terstandar tertinggi diberi label dalam grafik.
Terlihat observasi pada baris 30, 62 dan 117 mempunyai standardized residual tertinggi.
Hal ini tidak berarti bahwa pengamatan ini merupakan outlier, namun Anda mungkin ingin melihat data asli untuk memeriksa pengamatan ini lebih dekat.
Meskipun kita dapat melihat bahwa garis merah kira-kira horizontal pada plot lokasi skala, ini hanya berfungsi sebagai cara visual untuk melihat apakah asumsi homoskedastisitas terpenuhi.
Uji statistik formal yang dapat kita gunakan untuk melihat apakah asumsi homoskedastisitas terpenuhi adalah uji Breusch-Pagan .
Tes Breusch-Pagan di R
Kode berikut menunjukkan cara menggunakan fungsi bptest() dari paket lmtest untuk melakukan pengujian Breusch-Pagan di R:
#load lmtest package library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 1.4798, df = 1, p-value = 0.2238
Tes Breusch-Pagan menggunakan hipotesis nol dan alternatif berikut:
- Hipotesis nol (H 0 ): residu bersifat homoskedastik (yaitu terdistribusi secara merata)
- Hipotesis alternatif ( HA ): Residunya bersifat heteroskedastis (yaitu tidak terdistribusi secara merata)
Dari hasil tersebut terlihat bahwa p-value pengujian tersebut adalah 0,2238 . Karena nilai p ini tidak kurang dari 0,05, kita gagal menolak hipotesis nol. Kami tidak memiliki cukup bukti untuk menyatakan bahwa terdapat heteroskedastisitas dalam model regresi.
Hasil ini cocok dengan inspeksi visual kami terhadap garis merah di plot skala-lokasi.
Sumber daya tambahan
Pengertian Heteroskedastisitas dalam Analisis Regresi
Cara membuat plot sisa di R
Cara melakukan tes Breusch-Pagan di R