Regresi linier berganda

Artikel ini menjelaskan apa itu regresi linier berganda dalam statistik. Selain itu, Anda akan mempelajari cara membuat model regresi linier berganda dan cara menafsirkannya.

Apa itu regresi linier berganda?

Regresi linier berganda adalah model regresi yang memasukkan dua atau lebih variabel independen. Dengan kata lain, regresi linier berganda adalah model statistik yang memungkinkan beberapa variabel penjelas dihubungkan secara linier ke suatu variabel respon.

Oleh karena itu, model regresi linier berganda digunakan untuk mencari persamaan yang menghubungkan dua atau lebih variabel bebas terhadap suatu variabel terikat. Jadi, dengan mensubstitusi nilai masing-masing variabel independen, diperoleh perkiraan nilai variabel dependen.

Misalnya persamaan y=3+6x 1 -4x 2 +7x 3 merupakan model regresi linier berganda karena secara matematis menghubungkan tiga variabel bebas (x 1 , x 2 , x 3 ) dengan satu variabel terikat (y) jalur nilai linier .

Rumus Regresi Linier Berganda

Persamaan model regresi linier berganda adalah y=β 01 x 12 x 2 +…+β m x m +ε.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Emas:

  • y

    adalah variabel terikat.

  • x_i

    adalah variabel bebas i.

  • \beta_0

    adalah konstanta persamaan regresi linier berganda.

  • \beta_i

    adalah koefisien regresi yang terkait dengan variabel

    x_i

    .

  • \bm{\varepsilon}

    Ini adalah kesalahan atau sisa, yaitu selisih antara nilai yang diamati dan nilai yang diestimasi oleh model.

  • m

    adalah jumlah total variabel dalam model.

Jadi jika kita mempunyai sampel dengan jumlah total

n

pengamatan, kita dapat mengusulkan model regresi linier berganda dalam bentuk matriks:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Ekspresi array di atas dapat ditulis ulang dengan memberikan huruf pada setiap array:

Y=X\beta+\varepsilon

Jadi, dengan menerapkan kriteria kuadrat terkecil, kita dapat memperoleh rumus untuk memperkirakan koefisien model regresi linier berganda :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Namun penerapan rumus ini sangat melelahkan dan memakan waktu, sehingga dalam praktiknya disarankan untuk menggunakan perangkat lunak komputer (seperti Minitab atau Excel) yang memungkinkan menjalankan model regresi berganda dengan lebih cepat.

Asumsi Regresi Linier Berganda

Dalam model regresi linier berganda, syarat-syarat berikut harus dipenuhi agar model tersebut valid:

  • Kemandirian : residu harus independen satu sama lain. Cara umum untuk memastikan independensi model adalah dengan menambahkan keacakan pada proses pengambilan sampel.
  • Homoskedastisitas : Harus ada homogenitas varians dari residu, yaitu variabilitas dari residu harus konstan.
  • Non-multikolinearitas : variabel penjelas yang dimasukkan dalam model tidak dapat dihubungkan satu sama lain atau setidaknya hubungannya harus sangat lemah.
  • Normalitas : Residunya harus berdistribusi normal, atau dengan kata lain harus mengikuti distribusi normal dengan mean 0.
  • Linearitas : Diasumsikan hubungan antara variabel respon dan variabel penjelas adalah linier.

Menafsirkan Model Regresi Linier Berganda

Untuk menginterpretasikan model regresi linier berganda, kita harus melihat koefisien determinasi (R kuadrat), yang menyatakan persentase yang dijelaskan oleh model regresi. Dengan demikian, semakin tinggi koefisien determinasi maka model tersebut akan semakin disesuaikan dengan data sampel yang diteliti.

Namun, kesesuaian model statistik dapat menyesatkan, khususnya dalam model regresi linier berganda. Karena ketika suatu variabel ditambahkan ke dalam model, koefisien determinasinya meningkat meskipun variabel tersebut tidak signifikan. Namun, koefisien determinasi perlu dimaksimalkan dengan mencoba meminimalkan jumlah variabel, karena model tidak terlalu rumit dan lebih mudah untuk diinterpretasikan.

Untuk mengatasi masalah ini, perlu untuk menghitung koefisien determinasi yang disesuaikan (adjusted R squared), yaitu koefisien statistik yang mengukur kualitas kecocokan model regresi, memberikan penalti untuk setiap variabel yang ditambahkan ke model, tidak seperti koefisien yang tidak disesuaikan. tekad. ini tidak memperhitungkan jumlah variabel dalam model.

Dengan demikian, koefisien determinasi yang disesuaikan memungkinkan kita membandingkan kesesuaian dua model dengan jumlah variabel yang berbeda. Pada prinsipnya sebaiknya memilih model yang mempunyai koefisien determinasi yang disesuaikan lebih tinggi, namun jika kedua model mempunyai nilai yang sangat mirip, lebih baik memilih model dengan variabel yang lebih sedikit karena lebih mudah untuk diinterpretasikan.

Sebaliknya, koefisien regresi menunjukkan hubungan antara variabel penjelas dan variabel respon. Jika koefisien regresi bernilai positif maka variabel respon akan meningkat seiring dengan meningkatnya variabel penjelas. sedangkan jika koefisien regresinya negatif maka variabel respon akan menurun ketika variabel penjelasnya meningkat.

Logikanya, agar kondisi sebelumnya terpenuhi, variabel lain harus tetap konstan. Inilah sebabnya mengapa penting agar tidak terjadi multikolinearitas antara berbagai variabel penjelas model. Anda dapat melihat bagaimana multikolinearitas suatu model dipelajari dengan mencari artikel terkait di situs web kami.

Regresi linier berganda dan sederhana

Terakhir, kita akan melihat apa perbedaan antara model regresi linier sederhana dan model regresi linier berganda, karena keduanya merupakan dua model regresi yang banyak digunakan dalam statistik.

Regresi linier sederhana merupakan model regresi yang digunakan untuk menghubungkan suatu variabel independen. Jadi persamaan model regresi linier sederhana adalah sebagai berikut:

y=\beta_0+\beta_1x_1+\varepsilon

Oleh karena itu, perbedaan antara regresi linier berganda dan regresi linier sederhana terletak pada jumlah variabel penjelasnya. Model regresi linier berganda memiliki dua atau lebih variabel penjelas, sedangkan model regresi linier sederhana hanya memiliki satu variabel penjelas.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Kesimpulannya, regresi linier berganda merupakan perpanjangan dari regresi linier sederhana, karena lebih banyak variabel penjelas dan koefisien regresi masing-masing ditambahkan secara sederhana. Namun, koefisien regresi dihitung secara berbeda, untuk melihat cara melakukannya klik di sini:

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *