Analisis regresi

Artikel ini menjelaskan apa itu analisis regresi dan kegunaannya dalam statistik. Selain itu, Anda akan dapat melihat apa saja jenis analisis regresi.

Apa itu analisis regresi?

Dalam statistik, analisis regresi adalah proses mempelajari hubungan antara dua variabel atau lebih. Lebih khusus lagi, analisis regresi melibatkan penghitungan persamaan yang menghubungkan variabel-variabel dalam penelitian secara matematis.

Model yang dibangun dalam analisis regresi disebut model regresi, sedangkan persamaan yang menghubungkan variabel-variabel yang diteliti disebut persamaan regresi.

Misalnya, jika Anda ingin mempelajari hubungan antara inflasi suatu negara dan PDB-nya, Anda dapat melakukan analisis regresi untuk menganalisis hubungan antara kedua variabel tersebut. Dalam hal ini persamaan yang diperoleh dari analisis regresi adalah garis regresi.

analisis regresi

Dengan demikian, analisis regresi terdiri dari pengumpulan data sampel dan, dari data yang dikumpulkan, dihitung persamaan yang memungkinkan variabel-variabel yang diteliti berhubungan secara matematis.

Dalam analisis regresi, penting untuk membedakan dua jenis variabel yang dapat dimasukkan ke dalam model regresi:

  • Variabel terikat (atau variabel respon) : inilah faktor yang ingin kita analisis, maka akan dibangun model regresi untuk melihat bagaimana nilai variabel ini bervariasi tergantung pada nilai variabel lainnya.
  • Variabel bebas (atau variabel penjelas) : merupakan faktor yang kita anggap mungkin mempengaruhi variabel yang ingin kita analisis. Artinya, nilai variabel independen mempengaruhi nilai variabel dependen.

Jenis Analisis Regresi

Pada dasarnya, ada tiga jenis analisis regresi :

  • Analisis Regresi Linier Sederhana : Model regresi mempunyai variabel bebas dan variabel terikat dan berhubungan linier.
  • Analisis regresi linier berganda : dua atau lebih variabel bebas mempunyai hubungan linier terhadap suatu variabel terikat.
  • Analisis regresi nonlinier : Hubungan antara variabel bebas dan variabel terikat dimodelkan menggunakan fungsi nonlinier.

Analisis regresi linier sederhana

Regresi linier sederhana digunakan untuk menghubungkan suatu variabel bebas dengan kedua variabel tersebut dengan menggunakan persamaan linier.

Persamaan model regresi linier sederhana berbentuk garis lurus, oleh karena itu terdiri dari dua koefisien: konstanta persamaan (β 0 ) dan koefisien korelasi kedua variabel (β 1 ). Oleh karena itu, persamaan model regresi linier sederhana adalah y=β 01 x.

y=\beta_0+\beta_1x

Rumus untuk menghitung koefisien regresi linier sederhana adalah sebagai berikut:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

Emas:

  • \beta_0

    adalah konstanta garis regresi.

  • \beta_1

    adalah kemiringan garis regresi.

  • x_i

    adalah nilai variabel bebas X dari data i.

  • y_i

    adalah nilai variabel terikat Y dari data i.

  • \overline{x}

    adalah rata-rata dari nilai variabel bebas

  • \overline{y}

    adalah rata-rata nilai variabel terikat Y.

Analisis regresi linier berganda

Dalam model regresi linier berganda , setidaknya ada dua variabel independen yang dimasukkan. Dengan kata lain, regresi linier berganda memungkinkan beberapa variabel penjelas dihubungkan secara linier ke suatu variabel respon. Oleh karena itu, persamaan model regresi linier berganda adalah:

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Emas:

  • y

    adalah variabel terikat.

  • x_i

    adalah variabel bebas i.

  • \beta_0

    adalah konstanta persamaan regresi linier berganda.

  • \beta_i

    adalah koefisien regresi yang terkait dengan variabel

    x_i

    .

  • \bm{\varepsilon}

    adalah kesalahan atau sisa, yaitu selisih antara nilai yang diamati dan nilai yang diestimasi oleh model.

  • m

    adalah jumlah total variabel dalam model.

Jadi jika kita mempunyai sampel dengan jumlah total

n

pengamatan, kita dapat mengajukan model regresi linier berganda dalam bentuk matriks:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Ekspresi matriks di atas dapat ditulis ulang dengan memberikan huruf pada setiap matriks:

Y=X\beta+\varepsilon

Jadi, dengan menerapkan kriteria kuadrat terkecil, kita dapat memperoleh rumus untuk memperkirakan koefisien model regresi linier berganda :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Namun penerapan rumus ini sangat melelahkan dan memakan waktu, oleh karena itu dalam praktiknya disarankan untuk menggunakan perangkat lunak komputer (seperti Minitab atau Excel) yang memungkinkan pembuatan model regresi berganda dengan lebih cepat.

Analisis regresi nonlinier

Dalam statistika, regresi nonlinier adalah salah satu jenis regresi yang menggunakan fungsi nonlinier sebagai model persamaan regresinya. Oleh karena itu, persamaan model regresi nonlinier merupakan fungsi nonlinier.

Logikanya, regresi nonlinier digunakan untuk menghubungkan variabel bebas dengan variabel terikat apabila hubungan kedua variabel tersebut tidak linier. Jadi, jika pada saat membuat grafik data sampel kita mengamati bahwa data tersebut tidak mempunyai hubungan linier, yaitu kurang lebih tidak membentuk garis lurus, sebaiknya gunakan model regresi nonlinier.

Misalnya, persamaan y=3-5x-8x 2 +x 3 merupakan model regresi nonlinier karena secara matematis menghubungkan variabel bebas X ke variabel terikat Y melalui fungsi kubik.

Pada dasarnya ada tiga jenis regresi nonlinier :

  • Regresi Polinomial – Regresi nonlinier yang persamaannya berbentuk polinomial.
  • y=\beta_0+\beta_1 x+\beta_2 x^2+\beta_3 x^3+\dots+\beta_m x^m

  • Regresi Logaritmik – Regresi nonlinier yang variabel independennya dilogaritma.
  • y=\beta_0+\beta_1\cdot \ln(x)

  • Regresi Eksponensial – Regresi nonlinier yang variabel independennya berada pada eksponen persamaan.
  • y=\beta_0\cdot e^{\beta_1\cdot x}

Lihat: Regresi nonlinier

Untuk apa analisis regresi digunakan?

Analisis regresi pada dasarnya mempunyai dua kegunaan: Analisis regresi digunakan untuk menjelaskan hubungan antara variabel penjelas dan variabel respon, dan demikian pula analisis regresi digunakan untuk memprediksi nilai variabel terikat pada suatu observasi baru.

Dengan memperoleh persamaan model regresi, kita dapat mengetahui jenis hubungan apa yang ada antar variabel dalam model. Jika koefisien regresi suatu variabel independen bernilai positif, maka variabel dependennya akan semakin meningkat. sedangkan jika koefisien regresi suatu variabel independen bernilai negatif, maka variabel dependennya akan menurun seiring dengan kenaikannya.

Di sisi lain, persamaan matematis yang diperoleh dari analisis regresi juga memungkinkan kita membuat prediksi nilai. Jadi, dengan memasukkan nilai variabel penjelas ke dalam persamaan model regresi, kita dapat menghitung nilai variabel terikat untuk suatu data baru.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *