Regresi linier
Artikel ini menjelaskan apa itu regresi linier dan kegunaannya dalam statistik. Selain itu, Anda akan dapat melihat cara menghitung dua jenis regresi linier: regresi linier sederhana dan regresi linier berganda.
Apa itu regresi linier?
Regresi linier adalah model statistik yang menghubungkan satu atau lebih variabel bebas dengan suatu variabel terikat. Sederhananya, regresi linier adalah teknik yang digunakan untuk mencari persamaan yang mendekati hubungan antara satu atau lebih variabel penjelas dan variabel respon.
Misalnya persamaan y=2+5x 1 -3x 2 +8x 3 merupakan model regresi linier karena secara matematis menghubungkan tiga variabel bebas (x 1 , x 2 , x 3 ) dengan variabel terikat (y) dan terlebih lagi, hubungan antar variabel bersifat linier.
Jenis Regresi Linier
Ada dua jenis regresi linier :
- Regresi linier sederhana : Sebuah variabel independen dihubungkan dengan variabel dependen. Oleh karena itu, persamaan untuk model regresi linier jenis ini berbentuk y=β 0 +β 1 x 1 .
- Regresi linier berganda : Model regresi memiliki beberapa variabel penjelas dan satu variabel respon. Oleh karena itu, persamaan model regresi linier jenis ini berbentuk y=β 0 +β 1 x 1 +β 2 x 2 …+β m x m .
regresi linier sederhana
Regresi linier sederhana digunakan untuk menghubungkan satu variabel independen dengan kedua variabel.
Persamaan model regresi linier sederhana berbentuk garis lurus, oleh karena itu terdiri dari dua koefisien: konstanta persamaan (β 0 ) dan koefisien korelasi kedua variabel (β 1 ). Oleh karena itu, persamaan model regresi linier sederhana adalah y=β 0 +β 1 x.
Rumus untuk menghitung koefisien regresi linier sederhana adalah sebagai berikut:
Emas:
-
adalah konstanta garis regresi.
-
adalah kemiringan garis regresi.
-
adalah nilai variabel bebas X dari data i.
-
adalah nilai variabel terikat Y dari data i.
-
adalah rata-rata dari nilai variabel bebas
-
adalah rata-rata nilai variabel terikat Y.
Regresi linier berganda
Dalam model regresi linier berganda , setidaknya ada dua variabel independen yang dimasukkan. Dengan kata lain, regresi linier berganda memungkinkan beberapa variabel penjelas dihubungkan secara linier ke suatu variabel respon.
Persamaan model regresi linier berganda adalah y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε.
Emas:
-
adalah variabel terikat.
-
adalah variabel bebas i.
-
adalah konstanta persamaan regresi linier berganda.
-
adalah koefisien regresi yang terkait dengan variabel
.
-
adalah kesalahan atau sisa, yaitu selisih antara nilai yang diamati dan nilai yang diestimasi oleh model.
-
adalah jumlah total variabel dalam model.
Jadi jika kita mempunyai sampel dengan jumlah total
pengamatan, kita dapat mengajukan model regresi linier berganda dalam bentuk matriks:
Ekspresi matriks di atas dapat ditulis ulang dengan memberikan huruf pada setiap matriks:
Jadi, dengan menerapkan kriteria kuadrat terkecil, kita dapat memperoleh rumus untuk memperkirakan koefisien model regresi linier berganda :
Namun penerapan rumus ini sangat melelahkan dan memakan waktu, oleh karena itu dalam praktiknya disarankan untuk menggunakan perangkat lunak komputer (seperti Minitab atau Excel) yang memungkinkan pembuatan model regresi berganda dengan lebih cepat.
Asumsi Regresi Linier
Dalam model regresi linier, syarat-syarat berikut harus dipenuhi agar model tersebut valid:
- Kemandirian : Residu harus independen satu sama lain. Cara umum untuk memastikan independensi model adalah dengan menambahkan keacakan pada proses pengambilan sampel.
- Homoskedastisitas : Harus ada homogenitas varians dari residu, yaitu variabilitas dari residu harus konstan.
- Non-multikolinearitas : variabel penjelas yang dimasukkan dalam model tidak dapat dihubungkan satu sama lain atau setidaknya hubungannya harus sangat lemah.
- Normalitas : Residualnya harus berdistribusi normal, atau dengan kata lain harus mengikuti distribusi normal dengan mean 0.
- Linearitas : diasumsikan hubungan antara variabel respon dan variabel penjelas adalah linier.
Untuk apa regresi linier digunakan?
Regresi linier pada dasarnya mempunyai dua kegunaan: Regresi linier digunakan untuk menjelaskan hubungan antara variabel penjelas dan variabel respon, dan demikian pula, regresi linier digunakan untuk memprediksi nilai variabel terikat pada suatu observasi baru.
Dengan memperoleh persamaan model regresi linier, kita dapat mengetahui jenis hubungan apa yang ada antar variabel dalam model. Jika koefisien regresi suatu variabel independen bernilai positif, maka variabel dependennya akan semakin meningkat. sedangkan jika koefisien regresi suatu variabel independen bernilai negatif, maka variabel dependennya akan menurun seiring dengan kenaikannya.
Di sisi lain, persamaan yang dihitung dalam regresi linier juga memungkinkan dilakukannya prediksi nilai. Jadi, dengan memasukkan nilai variabel penjelas ke dalam persamaan model, kita dapat menghitung nilai variabel terikat untuk suatu data baru.