Regresi linier berganda
Artikel ini menjelaskan apa itu regresi linier berganda dalam statistik. Selain itu, Anda akan mempelajari cara membuat model regresi linier berganda dan cara menafsirkannya.
Apa itu regresi linier berganda?
Regresi linier berganda adalah model regresi yang memasukkan dua atau lebih variabel independen. Dengan kata lain, regresi linier berganda adalah model statistik yang memungkinkan beberapa variabel penjelas dihubungkan secara linier ke suatu variabel respon.
Oleh karena itu, model regresi linier berganda digunakan untuk mencari persamaan yang menghubungkan dua atau lebih variabel bebas terhadap suatu variabel terikat. Jadi, dengan mensubstitusi nilai masing-masing variabel independen, diperoleh perkiraan nilai variabel dependen.
Misalnya persamaan y=3+6x 1 -4x 2 +7x 3 merupakan model regresi linier berganda karena secara matematis menghubungkan tiga variabel bebas (x 1 , x 2 , x 3 ) dengan satu variabel terikat (y) jalur nilai linier .
Rumus Regresi Linier Berganda
Persamaan model regresi linier berganda adalah y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε.
Emas:
-
adalah variabel terikat.
-
adalah variabel bebas i.
-
adalah konstanta persamaan regresi linier berganda.
-
adalah koefisien regresi yang terkait dengan variabel
.
-
Ini adalah kesalahan atau sisa, yaitu selisih antara nilai yang diamati dan nilai yang diestimasi oleh model.
-
adalah jumlah total variabel dalam model.
Jadi jika kita mempunyai sampel dengan jumlah total
pengamatan, kita dapat mengusulkan model regresi linier berganda dalam bentuk matriks:
Ekspresi array di atas dapat ditulis ulang dengan memberikan huruf pada setiap array:
Jadi, dengan menerapkan kriteria kuadrat terkecil, kita dapat memperoleh rumus untuk memperkirakan koefisien model regresi linier berganda :
Namun penerapan rumus ini sangat melelahkan dan memakan waktu, sehingga dalam praktiknya disarankan untuk menggunakan perangkat lunak komputer (seperti Minitab atau Excel) yang memungkinkan menjalankan model regresi berganda dengan lebih cepat.
Asumsi Regresi Linier Berganda
Dalam model regresi linier berganda, syarat-syarat berikut harus dipenuhi agar model tersebut valid:
- Kemandirian : residu harus independen satu sama lain. Cara umum untuk memastikan independensi model adalah dengan menambahkan keacakan pada proses pengambilan sampel.
- Homoskedastisitas : Harus ada homogenitas varians dari residu, yaitu variabilitas dari residu harus konstan.
- Non-multikolinearitas : variabel penjelas yang dimasukkan dalam model tidak dapat dihubungkan satu sama lain atau setidaknya hubungannya harus sangat lemah.
- Normalitas : Residunya harus berdistribusi normal, atau dengan kata lain harus mengikuti distribusi normal dengan mean 0.
- Linearitas : Diasumsikan hubungan antara variabel respon dan variabel penjelas adalah linier.
Menafsirkan Model Regresi Linier Berganda
Untuk menginterpretasikan model regresi linier berganda, kita harus melihat koefisien determinasi (R kuadrat), yang menyatakan persentase yang dijelaskan oleh model regresi. Dengan demikian, semakin tinggi koefisien determinasi maka model tersebut akan semakin disesuaikan dengan data sampel yang diteliti.
Namun, kesesuaian model statistik dapat menyesatkan, khususnya dalam model regresi linier berganda. Karena ketika suatu variabel ditambahkan ke dalam model, koefisien determinasinya meningkat meskipun variabel tersebut tidak signifikan. Namun, koefisien determinasi perlu dimaksimalkan dengan mencoba meminimalkan jumlah variabel, karena model tidak terlalu rumit dan lebih mudah untuk diinterpretasikan.
Untuk mengatasi masalah ini, perlu untuk menghitung koefisien determinasi yang disesuaikan (adjusted R squared), yaitu koefisien statistik yang mengukur kualitas kecocokan model regresi, memberikan penalti untuk setiap variabel yang ditambahkan ke model, tidak seperti koefisien yang tidak disesuaikan. tekad. ini tidak memperhitungkan jumlah variabel dalam model.
Dengan demikian, koefisien determinasi yang disesuaikan memungkinkan kita membandingkan kesesuaian dua model dengan jumlah variabel yang berbeda. Pada prinsipnya sebaiknya memilih model yang mempunyai koefisien determinasi yang disesuaikan lebih tinggi, namun jika kedua model mempunyai nilai yang sangat mirip, lebih baik memilih model dengan variabel yang lebih sedikit karena lebih mudah untuk diinterpretasikan.
Sebaliknya, koefisien regresi menunjukkan hubungan antara variabel penjelas dan variabel respon. Jika koefisien regresi bernilai positif maka variabel respon akan meningkat seiring dengan meningkatnya variabel penjelas. sedangkan jika koefisien regresinya negatif maka variabel respon akan menurun ketika variabel penjelasnya meningkat.
Logikanya, agar kondisi sebelumnya terpenuhi, variabel lain harus tetap konstan. Inilah sebabnya mengapa penting agar tidak terjadi multikolinearitas antara berbagai variabel penjelas model. Anda dapat melihat bagaimana multikolinearitas suatu model dipelajari dengan mencari artikel terkait di situs web kami.
Regresi linier berganda dan sederhana
Terakhir, kita akan melihat apa perbedaan antara model regresi linier sederhana dan model regresi linier berganda, karena keduanya merupakan dua model regresi yang banyak digunakan dalam statistik.
Regresi linier sederhana merupakan model regresi yang digunakan untuk menghubungkan suatu variabel independen. Jadi persamaan model regresi linier sederhana adalah sebagai berikut:
Oleh karena itu, perbedaan antara regresi linier berganda dan regresi linier sederhana terletak pada jumlah variabel penjelasnya. Model regresi linier berganda memiliki dua atau lebih variabel penjelas, sedangkan model regresi linier sederhana hanya memiliki satu variabel penjelas.
Kesimpulannya, regresi linier berganda merupakan perpanjangan dari regresi linier sederhana, karena lebih banyak variabel penjelas dan koefisien regresi masing-masing ditambahkan secara sederhana. Namun, koefisien regresi dihitung secara berbeda, untuk melihat cara melakukannya klik di sini: