Regresi linier

Artikel ini menjelaskan apa itu regresi linier dan kegunaannya dalam statistik. Selain itu, Anda akan dapat melihat cara menghitung dua jenis regresi linier: regresi linier sederhana dan regresi linier berganda.

Apa itu regresi linier?

Regresi linier adalah model statistik yang menghubungkan satu atau lebih variabel bebas dengan suatu variabel terikat. Sederhananya, regresi linier adalah teknik yang digunakan untuk mencari persamaan yang mendekati hubungan antara satu atau lebih variabel penjelas dan variabel respon.

Misalnya persamaan y=2+5x 1 -3x 2 +8x 3 merupakan model regresi linier karena secara matematis menghubungkan tiga variabel bebas (x 1 , x 2 , x 3 ) dengan variabel terikat (y) dan terlebih lagi, hubungan antar variabel bersifat linier.

Jenis Regresi Linier

Ada dua jenis regresi linier :

  • Regresi linier sederhana : Sebuah variabel independen dihubungkan dengan variabel dependen. Oleh karena itu, persamaan untuk model regresi linier jenis ini berbentuk y=β 01 x 1 .
  • Regresi linier berganda : Model regresi memiliki beberapa variabel penjelas dan satu variabel respon. Oleh karena itu, persamaan model regresi linier jenis ini berbentuk y=β 01 x 12 x 2 …+β m x m .

regresi linier sederhana

Regresi linier sederhana digunakan untuk menghubungkan satu variabel independen dengan kedua variabel.

Persamaan model regresi linier sederhana berbentuk garis lurus, oleh karena itu terdiri dari dua koefisien: konstanta persamaan (β 0 ) dan koefisien korelasi kedua variabel (β 1 ). Oleh karena itu, persamaan model regresi linier sederhana adalah y=β 01 x.

y=\beta_0+\beta_1x

Rumus untuk menghitung koefisien regresi linier sederhana adalah sebagai berikut:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

Emas:

  • \beta_0

    adalah konstanta garis regresi.

  • \beta_1

    adalah kemiringan garis regresi.

  • x_i

    adalah nilai variabel bebas X dari data i.

  • y_i

    adalah nilai variabel terikat Y dari data i.

  • \overline{x}

    adalah rata-rata dari nilai variabel bebas

  • \overline{y}

    adalah rata-rata nilai variabel terikat Y.

Regresi linier berganda

Dalam model regresi linier berganda , setidaknya ada dua variabel independen yang dimasukkan. Dengan kata lain, regresi linier berganda memungkinkan beberapa variabel penjelas dihubungkan secara linier ke suatu variabel respon.

Persamaan model regresi linier berganda adalah y=β 01 x 12 x 2 +…+β m x m +ε.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Emas:

  • y

    adalah variabel terikat.

  • x_i

    adalah variabel bebas i.

  • \beta_0

    adalah konstanta persamaan regresi linier berganda.

  • \beta_i

    adalah koefisien regresi yang terkait dengan variabel

    x_i

    .

  • \bm{\varepsilon}

    adalah kesalahan atau sisa, yaitu selisih antara nilai yang diamati dan nilai yang diestimasi oleh model.

  • m

    adalah jumlah total variabel dalam model.

Jadi jika kita mempunyai sampel dengan jumlah total

n

pengamatan, kita dapat mengajukan model regresi linier berganda dalam bentuk matriks:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Ekspresi matriks di atas dapat ditulis ulang dengan memberikan huruf pada setiap matriks:

Y=X\beta+\varepsilon

Jadi, dengan menerapkan kriteria kuadrat terkecil, kita dapat memperoleh rumus untuk memperkirakan koefisien model regresi linier berganda :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Namun penerapan rumus ini sangat melelahkan dan memakan waktu, oleh karena itu dalam praktiknya disarankan untuk menggunakan perangkat lunak komputer (seperti Minitab atau Excel) yang memungkinkan pembuatan model regresi berganda dengan lebih cepat.

Asumsi Regresi Linier

Dalam model regresi linier, syarat-syarat berikut harus dipenuhi agar model tersebut valid:

  • Kemandirian : Residu harus independen satu sama lain. Cara umum untuk memastikan independensi model adalah dengan menambahkan keacakan pada proses pengambilan sampel.
  • Homoskedastisitas : Harus ada homogenitas varians dari residu, yaitu variabilitas dari residu harus konstan.
  • Non-multikolinearitas : variabel penjelas yang dimasukkan dalam model tidak dapat dihubungkan satu sama lain atau setidaknya hubungannya harus sangat lemah.
  • Normalitas : Residualnya harus berdistribusi normal, atau dengan kata lain harus mengikuti distribusi normal dengan mean 0.
  • Linearitas : diasumsikan hubungan antara variabel respon dan variabel penjelas adalah linier.

Untuk apa regresi linier digunakan?

Regresi linier pada dasarnya mempunyai dua kegunaan: Regresi linier digunakan untuk menjelaskan hubungan antara variabel penjelas dan variabel respon, dan demikian pula, regresi linier digunakan untuk memprediksi nilai variabel terikat pada suatu observasi baru.

Dengan memperoleh persamaan model regresi linier, kita dapat mengetahui jenis hubungan apa yang ada antar variabel dalam model. Jika koefisien regresi suatu variabel independen bernilai positif, maka variabel dependennya akan semakin meningkat. sedangkan jika koefisien regresi suatu variabel independen bernilai negatif, maka variabel dependennya akan menurun seiring dengan kenaikannya.

Di sisi lain, persamaan yang dihitung dalam regresi linier juga memungkinkan dilakukannya prediksi nilai. Jadi, dengan memasukkan nilai variabel penjelas ke dalam persamaan model, kita dapat menghitung nilai variabel terikat untuk suatu data baru.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *