Kapan sebaiknya anda menggunakan regresi polinomial?
Regresi polinomial adalah teknik yang dapat kita gunakan untuk menyesuaikan model regresi ketika hubungan antara variabel prediktor dan variabel respon bersifat nonlinier.
Model regresi polinomial mengambil bentuk berikut:
Y = β 0 + β 1 X + β 2 X 2 + … + β h
Dalam praktiknya, ada tiga cara sederhana untuk menentukan apakah Anda harus menggunakan regresi polinomial versus model yang lebih sederhana seperti regresi linier .
1. Membuat scatterplot variabel prediktor dan variabel respon
Cara termudah untuk menentukan apakah Anda harus menggunakan regresi polinomial adalah dengan membuat plot sebar sederhana dari variabel prediktor dan variabel respon.
Misalnya, kita ingin menggunakan variabel prediktor “jam belajar” untuk memprediksi nilai yang akan diterima siswa pada ujian akhir.
Sebelum memasang model regresi, terlebih dahulu kita dapat membuat diagram sebar jam belajar terhadap hasil ujian. Misalkan diagram sebar kita terlihat seperti ini:
Hubungan antara jam belajar dan hasil ujian tampak linier , jadi masuk akal untuk menyesuaikan model regresi linier sederhana ke kumpulan data ini.
Namun, mari kita asumsikan bahwa diagram sebar sebenarnya terlihat seperti berikut:
Hubungan ini nampaknya sedikit lebih nonlinier , sehingga memberi tahu kita bahwa sebaiknya menggunakan model regresi polinomial.
2. Buatlah grafik nilai pas dan nilai sisa
Cara lain untuk menentukan apakah Anda harus menggunakan regresi polinomial adalah dengan menyesuaikan model regresi linier dengan kumpulan data dan kemudian membuat plot nilai yang disesuaikan dengan residu model tersebut.
Jika terdapat tren nonlinier yang jelas pada residu, hal ini menunjukkan bahwa regresi polinomial mungkin lebih cocok dengan data.
Misalnya, kita menyesuaikan model regresi linier menggunakan jam belajar sebagai variabel prediktor dan nilai ujian sebagai variabel respons, lalu membuat plot nilai yang disesuaikan dengan residu berikut:
Residunya tersebar secara acak di sekitar nol tanpa pola yang jelas, yang menunjukkan bahwa model linier memberikan kesesuaian yang sesuai dengan data.
Namun, mari kita asumsikan bahwa plot nilai pas versus residu sebenarnya terlihat seperti berikut:
Dari grafik tersebut, kita dapat melihat bahwa terdapat pola non-linier yang jelas pada residu – residu menunjukkan bentuk “U”.
Hal ini menunjukkan bahwa model linier tidak sesuai untuk data tertentu dan mungkin lebih bijaksana jika menggunakan model regresi polinomial.
3. Hitung nilai R-kuadrat model yang disesuaikan
Cara lain untuk menentukan apakah Anda harus menggunakan regresi polinomial adalah dengan menyesuaikan model regresi linier dan model regresi polinomial serta menghitung nilai R-kuadrat yang sesuai untuk kedua model.
Adjusted R-squared mewakili proporsi varians variabel respon yang dapat dijelaskan oleh variabel prediktor dalam model, disesuaikan dengan jumlah variabel prediktor dalam model.
Model dengan R square yang disesuaikan tertinggi mewakili model yang paling mampu menggunakan variabel prediktor untuk menjelaskan variasi dalam variabel respon.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan regresi polinomial menggunakan perangkat lunak statistik yang berbeda:
Pengantar Regresi Polinomial
Bagaimana melakukan regresi polinomial di R
Cara melakukan regresi polinomial dengan Python
Cara Melakukan Regresi Polinomial di Excel