Regresi logistik vs regresi linier: perbedaan utama


Dua model regresi yang paling umum digunakan adalah regresi linier dan regresi logistik .

Kedua jenis model regresi ini digunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respons , namun ada beberapa perbedaan utama antara kedua model tersebut:

regresi logistik vs regresi linier

Berikut ringkasan perbedaannya:

Perbedaan #1: Jenis Variabel Respon

Model regresi linier digunakan ketika variabel respon mengambil nilai kontinu sehingga:

  • Harga
  • Tinggi
  • Usia
  • Jarak

Sebaliknya, model regresi logistik digunakan ketika variabel respon mengambil nilai kategorikal seperti:

  • ya atau tidak
  • Laki laki atau perempuan
  • Menang atau tidak menang

Perbedaan #2: persamaan yang digunakan

Regresi linier menggunakan persamaan berikut untuk merangkum hubungan antara variabel prediktor dan variabel respon:

Y = β 0 + β 1 X 1 + β 2 X 2 + … + β p

Emas:

  • Y : variabel respon
  • X j : variabel prediktif ke -j
  • β j : Efek rata-rata pada Y dari peningkatan satu unit X j , dengan menganggap semua prediktor lainnya tetap

Sebaliknya, regresi logistik menggunakan persamaan berikut:

p(X) = e β 0 + β 1 X 1 + β 2 X 2 + + β p

Persamaan ini digunakan untuk memprediksi probabilitas suatu pengamatan individu termasuk dalam kategori tertentu.

Perbedaan #3: Metode yang digunakan agar sesuai dengan persamaan

Regresi linier menggunakan metode yang disebut kuadrat terkecil biasa untuk menemukan persamaan regresi yang paling sesuai.

Sebaliknya, regresi logistik menggunakan metode yang disebut estimasi kemungkinan maksimum untuk menemukan persamaan regresi yang paling sesuai.

Perbedaan #4: keluaran yang akan diprediksi

Regresi linier memprediksi nilai kontinu sebagai keluaran. Misalnya:

  • Harga ($150, $199, $400, dll.)
  • Tinggi (14 inci, 2 kaki, 94,32 sentimeter, dll.)
  • Usia (2 bulan, 6 tahun, 41,5 tahun, dst.)
  • Jarak (1,23 mil, 4,5 kilometer, dll.)

Sebaliknya, regresi logistik memprediksi probabilitas sebagai suatu hasil. Misalnya:

  • 40,3% peluang diterima di universitas.
  • 93,2% peluang memenangkan permainan.
  • 34,2% kemungkinan suatu undang-undang akan diadopsi.

Kapan menggunakan regresi logistik atau linier

Latihan soal berikut dapat membantu Anda lebih memahami kapan harus menggunakan regresi logistik atau regresi linier.

Masalah #1: Pendapatan Tahunan

Misalkan seorang ekonom ingin menggunakan variabel prediktor (1) jam kerja mingguan dan (2) tahun pendidikan untuk memprediksi pendapatan tahunan individu.

Dalam skenario ini, ia akan menggunakan regresi linier karena variabel respon (pendapatan tahunan) bersifat kontinu.

Masalah #2: Penerimaan Perguruan Tinggi

Misalkan seorang petugas penerimaan perguruan tinggi ingin menggunakan variabel prediktor (1) IPK dan (2) skor ACT untuk memprediksi kemungkinan seorang siswa diterima di universitas tertentu.

Dalam skenario ini, dia akan menggunakan regresi logistik karena variabel respon bersifat kategoris dan hanya dapat mengambil dua nilai: diterima atau tidak diterima.

Masalah #3: Harga real estat

Misalkan seorang agen real estate ingin menggunakan variabel prediktor (1) luas persegi, (2) jumlah kamar tidur, dan (3) jumlah kamar mandi untuk memprediksi harga jual rumah.

Dalam skenario ini, dia akan menggunakan regresi linier karena variabel respon (harga) bersifat kontinu.

Masalah #4: Deteksi Spam

Misalkan seorang programmer komputer ingin menggunakan variabel prediktor (1) jumlah kata dan (2) negara asal untuk memprediksi kemungkinan bahwa email tertentu adalah spam.

Dalam skenario ini, akan menggunakan regresi logistik karena variabel respons bersifat kategoris dan hanya dapat mengambil dua nilai: spam atau bukan spam.

Sumber daya tambahan

Tutorial berikut menawarkan detail lebih lanjut tentang regresi linier:

Tutorial berikut menawarkan detail lebih lanjut tentang regresi logistik:

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *