Cara menafsirkan plot skala dan lokasi: dengan contoh


Bagan lokasi berskala adalah jenis bagan yang menampilkan nilai pas model regresi di sepanjang sumbu x dan akar kuadrat dari residu standar di sepanjang sumbu y.

Bagan lokasi berskala

Melihat grafik ini, kami memeriksa dua hal:

1. Pastikan garis merah kira-kira horizontal pada plot. Jika hal ini terjadi, maka asumsi homoskedastisitas kemungkinan terpenuhi untuk model regresi tertentu. Artinya, distribusi residu kira-kira sama untuk semua nilai yang dipasang.

2. Periksa apakah tidak ada tren yang jelas di antara residu. Dengan kata lain, residu harus tersebar secara acak di sekitar garis merah dengan variabilitas yang kira-kira sama untuk semua nilai yang sesuai.

Plot skala dan lokasi di R

Kita dapat menggunakan kode berikut untuk menyesuaikan model regresi linier sederhana di R dan menghasilkan plot skala dan lokasi untuk model yang dihasilkan:

 #fit simple linear regression model
model <- lm(Ozone ~ Temp, data = airquality)

#produce scale-location plot
plot(model)

Plot Lokasi Skala di R

Dua hal berikut dapat kita amati dari plot skala-lokasi model regresi ini.

1. Garis merah kira-kira horizontal pada plot. Jika hal ini terjadi, maka asumsi homoskedastisitas terpenuhi untuk model regresi tertentu. Artinya, distribusi residu kira-kira sama untuk semua nilai yang dipasang.

2. Periksa apakah tidak ada tren yang jelas di antara residu. Dengan kata lain, residu harus tersebar secara acak di sekitar garis merah dengan variabilitas yang kira-kira sama untuk semua nilai yang sesuai.

Catatan teknis

Tiga observasi dari kumpulan data dengan residu terstandar tertinggi diberi label dalam grafik.

Terlihat observasi pada baris 30, 62 dan 117 mempunyai standardized residual tertinggi.

Hal ini tidak berarti bahwa pengamatan ini merupakan outlier, namun Anda mungkin ingin melihat data asli untuk memeriksa pengamatan ini lebih dekat.

Meskipun kita dapat melihat bahwa garis merah kira-kira horizontal pada plot lokasi skala, ini hanya berfungsi sebagai cara visual untuk melihat apakah asumsi homoskedastisitas terpenuhi.

Uji statistik formal yang dapat kita gunakan untuk melihat apakah asumsi homoskedastisitas terpenuhi adalah uji Breusch-Pagan .

Tes Breusch-Pagan di R

Kode berikut menunjukkan cara menggunakan fungsi bptest() dari paket lmtest untuk melakukan pengujian Breusch-Pagan di R:

 #load lmtest package
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 1.4798, df = 1, p-value = 0.2238

Tes Breusch-Pagan menggunakan hipotesis nol dan alternatif berikut:

  • Hipotesis nol (H 0 ): residu bersifat homoskedastik (yaitu terdistribusi secara merata)
  • Hipotesis alternatif ( HA ): Residunya bersifat heteroskedastis (yaitu tidak terdistribusi secara merata)

Dari hasil tersebut terlihat bahwa p-value pengujian tersebut adalah 0,2238 . Karena nilai p ini tidak kurang dari 0,05, kita gagal menolak hipotesis nol. Kami tidak memiliki cukup bukti untuk menyatakan bahwa terdapat heteroskedastisitas dalam model regresi.

Hasil ini cocok dengan inspeksi visual kami terhadap garis merah di plot skala-lokasi.

Sumber daya tambahan

Pengertian Heteroskedastisitas dalam Analisis Regresi
Cara membuat plot sisa di R
Cara melakukan tes Breusch-Pagan di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *