Cara membuat jalur sisa dengan tangan
Plot sisa adalah jenis plot yang menampilkan nilai variabel prediktor dalam model regresi sepanjang sumbu x dan nilai residu sepanjang sumbu y.
Plot ini digunakan untuk mengevaluasi apakah residu model regresi berdistribusi normal dan menunjukkan heteroskedastisitas atau tidak.
Contoh langkah demi langkah berikut menunjukkan cara membuat plot sisa untuk model regresi secara manual.
Langkah 1: Temukan nilai prediksi
Misalkan kita ingin menyesuaikan model regresi dengan kumpulan data berikut:
Dengan menggunakan software statistik (seperti Excel, R, Python, SPSS, dll.), kita dapat melihat bahwa model regresi yang sesuai adalah:
kamu = 10,4486 + 1,3037(x)
Kita kemudian dapat menggunakan model ini untuk memprediksi nilai y berdasarkan nilai x. Misalnya, jika x = 3, maka kita memperkirakan y adalah:
kamu = 10,4486 + 1,3037(3) = 14,359
Kita dapat mengulangi proses ini untuk setiap observasi di kumpulan data kita:
Langkah 2: Temukan Residunya
Residual untuk observasi tertentu dalam kumpulan data kami dihitung sebagai berikut:
Residual = nilai observasi – nilai prediksi
Misalnya, sisa observasi pertama akan dihitung sebagai berikut:
Sisa = 15 – 14,359 = 0,641
Kita dapat mengulangi proses ini untuk setiap observasi di kumpulan data kita:
Langkah 3: Buat plot sisa
Terakhir, kita dapat membuat plot sisa dengan menempatkan nilai x di sepanjang sumbu x dan sisa di sepanjang sumbu y.
Misalnya, titik pertama yang akan kita tempatkan pada grafik kita adalah (3, 0,641)
Titik berikutnya yang akan kita tempatkan pada grafik kita adalah (5, 0,033)
Kami akan melanjutkan sampai kami menempatkan semua 10 kombinasi nilai x dan residu berpasangan dalam plot:
Setiap titik di atas nol pada grafik mewakili residu positif. Artinya nilai y observasi lebih besar dari nilai prediksi model regresi.
Setiap titik yang kurang dari nol menunjukkan residu negatif. Artinya nilai y observasi lebih rendah dari nilai prediksi model regresi.
Karena titik-titik pada grafik tersebar secara acak di sekitar residu 0 tanpa pola yang jelas, hal ini menunjukkan bahwa hubungan antara x dan y adalah linier dan layak menggunakan model regresi linier.
Dan karena residu tidak bertambah atau berkurang secara sistematis seiring bertambahnya variabel prediktor, berarti heteroskedastisitas tidak menjadi masalah pada model regresi ini.
Sumber daya tambahan
Tutorial berikut menjelaskan cara membuat plot sisa menggunakan perangkat lunak statistik yang berbeda:
Cara Membuat Plot Sisa pada Kalkulator TI-84
Cara Membuat Plot Sisa di Excel
Cara membuat plot sisa di R
Cara Membuat Plot Sisa dengan Python