Regresi logistik
Artikel ini menjelaskan apa itu regresi logistik dalam statistik. Demikian pula, Anda akan menemukan rumus regresi logistik, apa saja jenis-jenis regresi logistik dan, sebagai tambahan, latihan regresi logistik yang diselesaikan.
Apa itu regresi logistik?
Dalam statistik, regresi logistik adalah jenis model regresi yang digunakan untuk memprediksi hasil suatu variabel kategori . Artinya, regresi logistik digunakan untuk memodelkan probabilitas suatu variabel kategori mempunyai nilai tertentu berdasarkan variabel independen.
Model regresi logistik yang paling umum adalah regresi logistik biner, di mana hanya ada dua kemungkinan hasil: “kegagalan” atau “sukses” ( distribusi Bernoulli ). “Kegagalan” diwakili dengan nilai 0, sedangkan “keberhasilan” diwakili dengan nilai 1.
Misalnya, probabilitas seorang siswa lulus ujian berdasarkan jam belajarnya dapat dipelajari dengan menggunakan model regresi logistik. Dalam hal ini, kegagalan adalah akibat dari “kegagalan” dan sebaliknya kesuksesan adalah hasil dari “keberhasilan”.
Rumus Regresi Logistik
Persamaan model regresi logistik adalah:
Oleh karena itu, dalam model regresi logistik, probabilitas diperolehnya hasil “berhasil” yaitu variabel terikat bernilai 1 dihitung dengan rumus sebagai berikut:
Emas:
-
adalah probabilitas bahwa variabel dependen adalah 1.
-
adalah konstanta model regresi logistik.
-
adalah koefisien regresi variabel i.
-
adalah nilai variabel i.
Contoh Model Regresi Logistik
Setelah kita mengetahui pengertian regresi logistik, mari kita lihat contoh konkrit cara membuat model regresi jenis ini.
- Pada tabel berikut, serangkaian 20 data telah dikumpulkan yang menghubungkan jam belajar setiap siswa dan apakah mereka lulus atau gagal dalam ujian statistik. Jalankan model regresi logistik dan hitung peluang seorang siswa lulus jika dia belajar selama 4 jam.
Dalam hal ini variabel penjelasnya adalah jumlah jam belajar dan variabel responnya adalah siswa tersebut gagal (0) atau lulus (1). Oleh karena itu, dalam model kita, kita hanya memiliki koefisiennya saja
dan koefisien
, karena hanya ada satu variabel bebas.
Penentuan koefisien regresi secara manual sangat melelahkan, sehingga disarankan untuk menggunakan perangkat lunak komputer seperti Minitab. Dengan demikian, nilai koefisien regresi yang dihitung menggunakan Minitab adalah sebagai berikut:
Oleh karena itu model regresi logistiknya adalah sebagai berikut:
Di bawah ini Anda dapat melihat contoh data dan persamaan model regresi logistik dalam grafik:
Jadi, untuk menghitung peluang keberhasilan seorang siswa jika ia telah belajar selama 4 jam, cukup menggunakan persamaan yang diperoleh dari model regresi logistik:
Singkatnya, jika seorang siswa belajar selama empat jam, ia memiliki kemungkinan lulus ujian sebesar 86,99%.
Jenis Regresi Logistik
Ada tiga jenis regresi logistik :
- Regresi Logistik Biner : Variabel terikat hanya boleh memiliki dua nilai (0 dan 1).
- Regresi logistik multinomial : Variabel terikat memiliki lebih dari dua kemungkinan nilai.
- Regresi logistik ordinal : hasil yang mungkin terjadi memiliki tatanan alami.
Regresi logistik dan regresi linier
Terakhir, secara ringkas kita akan melihat apa perbedaan antara regresi logistik dan regresi linier, karena model regresi yang paling banyak digunakan dalam statistik adalah model linier.
Regresi linier digunakan untuk memodelkan variabel terikat numerik. Selain itu, dalam regresi linier, hubungan antara variabel penjelas dan variabel respon bersifat linier.
Oleh karena itu, perbedaan utama antara regresi logistik dan regresi linier adalah jenis variabel terikatnya. Dalam regresi logistik, variabel terikatnya bersifat kategoris, sedangkan variabel terikat dalam regresi linier berbentuk numerik.
Jadi, regresi logistik digunakan untuk memprediksi hasil antara dua kemungkinan pilihan, sedangkan regresi linier membantu memprediksi hasil numerik.