Regresi logistik vs regresi linier: perbedaan utama
Dua model regresi yang paling umum digunakan adalah regresi linier dan regresi logistik .
Kedua jenis model regresi ini digunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respons , namun ada beberapa perbedaan utama antara kedua model tersebut:
Berikut ringkasan perbedaannya:
Perbedaan #1: Jenis Variabel Respon
Model regresi linier digunakan ketika variabel respon mengambil nilai kontinu sehingga:
- Harga
- Tinggi
- Usia
- Jarak
Sebaliknya, model regresi logistik digunakan ketika variabel respon mengambil nilai kategorikal seperti:
- ya atau tidak
- Laki laki atau perempuan
- Menang atau tidak menang
Perbedaan #2: persamaan yang digunakan
Regresi linier menggunakan persamaan berikut untuk merangkum hubungan antara variabel prediktor dan variabel respon:
Y = β 0 + β 1 X 1 + β 2 X 2 + … + β p
Emas:
- Y : variabel respon
- X j : variabel prediktif ke -j
- β j : Efek rata-rata pada Y dari peningkatan satu unit X j , dengan menganggap semua prediktor lainnya tetap
Sebaliknya, regresi logistik menggunakan persamaan berikut:
p(X) = e β 0 + β 1 X 1 + β 2 X 2 + … + β p
Persamaan ini digunakan untuk memprediksi probabilitas suatu pengamatan individu termasuk dalam kategori tertentu.
Perbedaan #3: Metode yang digunakan agar sesuai dengan persamaan
Regresi linier menggunakan metode yang disebut kuadrat terkecil biasa untuk menemukan persamaan regresi yang paling sesuai.
Sebaliknya, regresi logistik menggunakan metode yang disebut estimasi kemungkinan maksimum untuk menemukan persamaan regresi yang paling sesuai.
Perbedaan #4: keluaran yang akan diprediksi
Regresi linier memprediksi nilai kontinu sebagai keluaran. Misalnya:
- Harga ($150, $199, $400, dll.)
- Tinggi (14 inci, 2 kaki, 94,32 sentimeter, dll.)
- Usia (2 bulan, 6 tahun, 41,5 tahun, dst.)
- Jarak (1,23 mil, 4,5 kilometer, dll.)
Sebaliknya, regresi logistik memprediksi probabilitas sebagai suatu hasil. Misalnya:
- 40,3% peluang diterima di universitas.
- 93,2% peluang memenangkan permainan.
- 34,2% kemungkinan suatu undang-undang akan diadopsi.
Kapan menggunakan regresi logistik atau linier
Latihan soal berikut dapat membantu Anda lebih memahami kapan harus menggunakan regresi logistik atau regresi linier.
Masalah #1: Pendapatan Tahunan
Misalkan seorang ekonom ingin menggunakan variabel prediktor (1) jam kerja mingguan dan (2) tahun pendidikan untuk memprediksi pendapatan tahunan individu.
Dalam skenario ini, ia akan menggunakan regresi linier karena variabel respon (pendapatan tahunan) bersifat kontinu.
Masalah #2: Penerimaan Perguruan Tinggi
Misalkan seorang petugas penerimaan perguruan tinggi ingin menggunakan variabel prediktor (1) IPK dan (2) skor ACT untuk memprediksi kemungkinan seorang siswa diterima di universitas tertentu.
Dalam skenario ini, dia akan menggunakan regresi logistik karena variabel respon bersifat kategoris dan hanya dapat mengambil dua nilai: diterima atau tidak diterima.
Masalah #3: Harga real estat
Misalkan seorang agen real estate ingin menggunakan variabel prediktor (1) luas persegi, (2) jumlah kamar tidur, dan (3) jumlah kamar mandi untuk memprediksi harga jual rumah.
Dalam skenario ini, dia akan menggunakan regresi linier karena variabel respon (harga) bersifat kontinu.
Masalah #4: Deteksi Spam
Misalkan seorang programmer komputer ingin menggunakan variabel prediktor (1) jumlah kata dan (2) negara asal untuk memprediksi kemungkinan bahwa email tertentu adalah spam.
Dalam skenario ini, akan menggunakan regresi logistik karena variabel respons bersifat kategoris dan hanya dapat mengambil dua nilai: spam atau bukan spam.
Sumber daya tambahan
Tutorial berikut menawarkan detail lebih lanjut tentang regresi linier:
- Pengantar Regresi Linier Sederhana
- Pengantar Regresi Linier Berganda
- 4 Contoh Penggunaan Regresi Linier dalam Kehidupan Nyata
Tutorial berikut menawarkan detail lebih lanjut tentang regresi logistik: