Apa yang dianggap sebagai plot sisa yang baik atau buruk?


Dalam analisis regresi, plot residu adalah jenis plot yang menampilkan nilai-nilai yang dipasang dari model regresi pada sumbu x dan residu model di sepanjang sumbu y.

Saat memeriksa tata letak sisa secara visual, kami biasanya mencari dua hal untuk menentukan apakah tata letak tersebut “baik” atau “buruk”:

1. Apakah residu menunjukkan tren yang jelas?

  • Dalam plot sisa yang “baik”, sisa-sisanya tidak menunjukkan tren yang jelas.
  • Dalam plot sisa yang “buruk”, sisa memiliki beberapa jenis pola seperti kurva atau gelombang. Hal ini menunjukkan bahwa model regresi yang kami gunakan tidak memberikan kesesuaian yang sesuai dengan data.

2. Apakah variansnya bertambah atau berkurang secara sistematis?

  • Dalam plot residu yang “baik”, residu tersebar secara acak di sekitar nol tanpa peningkatan atau penurunan varians secara sistematis.
  • Dalam plot residu yang “buruk”, varians dari residu bertambah atau berkurang secara sistematis.

Jika plot sisa dinilai “baik”, artinya kita dapat mempercayai hasil model regresi dan interpretasi koefisien model dapat dilakukan dengan aman.

Namun, jika plot sisa dinilai “buruk”, artinya hasil model tidak dapat diandalkan dan kita perlu menyesuaikan model regresi yang berbeda dengan data.

Contoh berikut menjelaskan cara menafsirkan plot sisa yang “baik” dan “buruk” dalam praktiknya.

Contoh 1: jejak sisa yang “baik”.

Misalkan kita memasang model regresi dan memperoleh plot sisa berikut:

contoh tata letak sisa yang baik

Kita dapat menjawab dua pertanyaan berikut untuk menentukan apakah ini merupakan plot sisa yang “baik”:

1. Apakah residu menunjukkan tren yang jelas?

Tidak. Sisanya tersebar secara acak di sekitar nol, tanpa pola yang jelas.

2. Apakah variansnya bertambah atau berkurang secara sistematis?

Tidak. Residual mempunyai varians yang cukup konstan (yaitu jarak antara residu dan nilai nol) pada setiap tingkat nilai yang dipasang.

Karena kami menjawab “Tidak” untuk kedua pertanyaan ini, kami menganggap ini sebagai plot sisa yang “baik”.

Oleh karena itu, kita dapat mempercayai hasil model regresi dan menginterpretasikan koefisien model dengan aman.

Contoh 2: plot sisa yang “buruk” dengan model yang jelas

Misalkan kita memasang model regresi dan memperoleh plot sisa berikut:

contoh sisa penelusuran buruk dengan pola melengkung

Kita dapat menjawab dua pertanyaan berikut untuk menentukan apakah ini merupakan plot sisa yang “baik”:

1. Apakah residu menunjukkan tren yang jelas?

Iya . Residunya menunjukkan pola melengkung.

2. Apakah variansnya bertambah atau berkurang secara sistematis?

Iya . Residu memiliki tingkat varian yang berbeda pada tingkat nilai yang berbeda.

Karena kami menjawab “Ya” untuk setidaknya satu dari pertanyaan-pertanyaan ini, kami akan menganggap ini sebagai plot sisa yang “buruk”.

Artinya model regresi tidak memberikan kecocokan yang baik terhadap data.

Secara khusus, pola melengkung pada plot residu menunjukkan bahwa model regresi linier gagal menyesuaikan data dan model regresi kuadratik kemungkinan akan berfungsi lebih baik.

Contoh 3: plot sisa yang “buruk” dengan varians yang semakin meningkat

Misalkan kita memasang model regresi dan memperoleh plot sisa berikut:

contoh plot sisa buruk yang heteroskedastisitas

Kita dapat menjawab dua pertanyaan berikut untuk menentukan apakah ini merupakan plot sisa yang “baik”:

1. Apakah residu menunjukkan tren yang jelas?

Tidak. Tidak ada tren yang jelas pada residunya.

2. Apakah variansnya bertambah atau berkurang secara sistematis?

Iya . Varians dari residu meningkat seiring dengan meningkatnya nilai yang dipasang.

Karena kami menjawab “Ya” untuk setidaknya satu dari pertanyaan-pertanyaan ini, kami akan menganggap ini sebagai plot sisa yang “buruk”.

Dalam contoh khusus ini, residu mengalami heteroskedastisitas , yang mengacu pada varians yang tidak sama dari residu pada tingkat nilai yang berbeda.

Artinya, hasil model regresi mungkin tidak dapat diandalkan.

Lihat artikel ini untuk mempelajari berbagai cara menyelesaikan masalah heteroskedastisitas dalam model regresi.

Sumber daya tambahan

Tutorial berikut menjelaskan cara membuat plot sisa menggunakan perangkat lunak statistik yang berbeda:

Cara membuat plot sisa di R
Cara Membuat Plot Sisa dengan Python
Cara Membuat Plot Sisa di Excel
Cara Membuat Plot Sisa di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *