Apa itu grafik residual/leverage? (definisi & #038; contoh)
Plot residu versus leverage adalah jenis bagan diagnostik yang memungkinkan kita mengidentifikasi pengamatan yang berpengaruh dalam model regresi.
Berikut tampilan plot jenis ini dalam bahasa pemrograman statistik R:
Setiap observasi dalam kumpulan data ditampilkan sebagai satu titik dalam plot. Sumbu x menunjukkan leverage setiap titik dan sumbu y menunjukkan sisa terstandarisasi setiap titik.
Leverage mengacu pada sejauh mana koefisien model regresi akan berubah jika observasi tertentu dikeluarkan dari kumpulan data.
Observasi dengan leverage yang tinggi mempunyai pengaruh yang kuat terhadap koefisien model regresi. Jika observasi ini dihilangkan, koefisien model akan berubah secara signifikan.
Residual terstandar mengacu pada perbedaan standar antara nilai prediksi suatu observasi dan nilai observasi sebenarnya.
Perlu dicatat bahwa suatu observasi mungkin memiliki nilai absolut yang tinggi untuk residu terstandar, namun nilai leverage yang rendah.
Bagaimana Menafsirkan Grafik Residual versus Leverage
Jika suatu titik pada grafik ini berada di luar jarak Cook (garis titik-titik merah), maka hal tersebut dianggap sebagai pengamatan yang berpengaruh.
Mari kita lihat grafik residu versus leverage yang ditunjukkan sebelumnya:
Pada contoh di atas terlihat bahwa observasi #10 paling dekat dengan batas jarak Cook, namun tidak keluar dari garis putus-putus. Artinya tidak ada titik yang berpengaruh dalam model regresi kita.
Namun, misalkan kita memiliki grafik sisa/leverage berikut:
Kita dapat melihat bahwa observasi #1 di pojok kanan atas berada di luar garis putus-putus merah. Hal ini menunjukkan bahwa ini adalah titik pengaruh .
Artinya, jika kita menghapus pengamatan ini dari kumpulan data dan memasang kembali model regresi, koefisien model akan berubah secara signifikan.
Bagaimana menangani observasi yang berpengaruh
Jika Anda membuat plot residu versus leverage untuk suatu model dan melihat bahwa satu atau beberapa observasi teridentifikasi berpengaruh, Anda dapat melakukan beberapa hal:
1. Verifikasi bahwa observasi tersebut bukan suatu kesalahan.
Sebelum mengambil tindakan apa pun, Anda harus terlebih dahulu memverifikasi bahwa observasi yang berpengaruh bukanlah akibat dari kesalahan entri data atau kejadian aneh lainnya.
2. Coba paskan model regresi lain.
Pengamatan yang berpengaruh mungkin menunjukkan bahwa model yang Anda tentukan tidak sesuai dengan data. Dalam hal ini, Anda dapat mencoba model regresi polinomial atau model nonlinier.
3. Hapus komentar berpengaruh.
Terakhir, Anda dapat memutuskan untuk menghapus observasi yang berpengaruh jika model yang Anda tentukan tampak cocok dengan data, kecuali untuk satu atau dua observasi yang berpengaruh.
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang cara menggunakan residu untuk mengevaluasi kesesuaian model regresi.
Apa yang dimaksud dengan residu dalam statistik?
Apa yang dimaksud dengan residu terstandar?
Bagaimana menafsirkan plot diagnostik di R