Cara membuat plot sisa di r


Plot sisa sering digunakan untuk menilai apakah sisa analisis regresi berdistribusi normal dan menunjukkan heteroskedastisitas atau tidak.

Tutorial ini menjelaskan cara membuat plot sisa untuk model regresi di R.

Contoh: Petak Sisa di R

Dalam contoh ini, kami akan menyesuaikan model regresi menggunakan kumpulan data R bawaan mtcars dan kemudian menghasilkan tiga plot residu yang berbeda untuk menganalisis residu.

Langkah 1: Sesuaikan model regresi.

Pertama, kita akan menyesuaikan model regresi menggunakan mpg sebagai variabel respon dan disp dan hp sebagai variabel penjelas:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Langkah 2: Buat plot sisa atau plot yang disesuaikan.

Selanjutnya, kita akan membuat plot residual/fitted, berguna untuk mendeteksi heteroskedastisitas secara visual – misalnya perubahan sistematis dalam distribusi residu pada rentang nilai.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Medan sisa atau disesuaikan di R

Sumbu x menampilkan nilai yang dipasang dan sumbu y menampilkan residu. Dari grafik kita dapat melihat bahwa distribusi residu cenderung lebih tinggi untuk nilai pas yang lebih tinggi, namun hal ini tampaknya tidak cukup parah sehingga kita perlu melakukan perubahan pada model.

Langkah 3: Buat plot QQ.

Kita juga dapat membuat plot QQ, yang berguna untuk menentukan apakah residu mengikuti distribusi normal. Jika nilai data pada plot mengikuti garis kira-kira lurus dengan sudut 45 derajat, maka data tersebut berdistribusi normal.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Plot QQ sisa di R

Kita dapat melihat bahwa residu cenderung sedikit menyimpang dari garis di dekat ekor, yang dapat menunjukkan bahwa residu tersebut tidak terdistribusi secara normal.

Langkah 4: Buat plot kepadatan.

Kami juga dapat membuat plot kepadatan, yang juga berguna untuk memeriksa secara visual apakah residu terdistribusi normal atau tidak. Jika plotnya kira-kira berbentuk lonceng, residunya mungkin mengikuti distribusi normal.

 #Create density plot of residuals
plot(density(res))

Kurva kepadatan sisa di R

Kita dapat melihat bahwa plot kepadatan secara kasar mengikuti bentuk lonceng, meskipun agak miring ke kanan. Tergantung pada jenis penelitiannya, seorang peneliti mungkin memutuskan atau tidak memutuskan untuk melakukan transformasi pada data untuk memastikan bahwa residu terdistribusi lebih normal.

Sumber daya tambahan

Cara menghitung residu standar di R
Cara menghitung residu siswa di R
Cara membuat histogram residu di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *