Cara membuat plot sisa di r
Plot sisa sering digunakan untuk menilai apakah sisa analisis regresi berdistribusi normal dan menunjukkan heteroskedastisitas atau tidak.
Tutorial ini menjelaskan cara membuat plot sisa untuk model regresi di R.
Contoh: Petak Sisa di R
Dalam contoh ini, kami akan menyesuaikan model regresi menggunakan kumpulan data R bawaan mtcars dan kemudian menghasilkan tiga plot residu yang berbeda untuk menganalisis residu.
Langkah 1: Sesuaikan model regresi.
Pertama, kita akan menyesuaikan model regresi menggunakan mpg sebagai variabel respon dan disp dan hp sebagai variabel penjelas:
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #get list of residuals res <- resid(model)
Langkah 2: Buat plot sisa atau plot yang disesuaikan.
Selanjutnya, kita akan membuat plot residual/fitted, berguna untuk mendeteksi heteroskedastisitas secara visual – misalnya perubahan sistematis dalam distribusi residu pada rentang nilai.
#produce residual vs. fitted plot plot(fitted(model), res) #add a horizontal line at 0 abline(0,0)
Sumbu x menampilkan nilai yang dipasang dan sumbu y menampilkan residu. Dari grafik kita dapat melihat bahwa distribusi residu cenderung lebih tinggi untuk nilai pas yang lebih tinggi, namun hal ini tampaknya tidak cukup parah sehingga kita perlu melakukan perubahan pada model.
Langkah 3: Buat plot QQ.
Kita juga dapat membuat plot QQ, yang berguna untuk menentukan apakah residu mengikuti distribusi normal. Jika nilai data pada plot mengikuti garis kira-kira lurus dengan sudut 45 derajat, maka data tersebut berdistribusi normal.
#create QQ plot for residuals qqnorm(res) #add a straight diagonal line to the plot qqline(res)
Kita dapat melihat bahwa residu cenderung sedikit menyimpang dari garis di dekat ekor, yang dapat menunjukkan bahwa residu tersebut tidak terdistribusi secara normal.
Langkah 4: Buat plot kepadatan.
Kami juga dapat membuat plot kepadatan, yang juga berguna untuk memeriksa secara visual apakah residu terdistribusi normal atau tidak. Jika plotnya kira-kira berbentuk lonceng, residunya mungkin mengikuti distribusi normal.
#Create density plot of residuals
plot(density(res))
Kita dapat melihat bahwa plot kepadatan secara kasar mengikuti bentuk lonceng, meskipun agak miring ke kanan. Tergantung pada jenis penelitiannya, seorang peneliti mungkin memutuskan atau tidak memutuskan untuk melakukan transformasi pada data untuk memastikan bahwa residu terdistribusi lebih normal.
Sumber daya tambahan
Cara menghitung residu standar di R
Cara menghitung residu siswa di R
Cara membuat histogram residu di R