Cara membuat prediksi dengan regresi linier
Regresi linier adalah metode yang dapat kita gunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respon .
Salah satu alasan paling umum untuk memasang model regresi adalah menggunakan model tersebut untuk memprediksi nilai observasi baru.
Kami menggunakan langkah-langkah berikut untuk membuat prediksi dengan model regresi:
- Langkah 1: Kumpulkan data.
- Langkah 2: Sesuaikan model regresi dengan data.
- Langkah 3: Verifikasi bahwa model sesuai dengan data.
- Langkah 4: Gunakan persamaan regresi yang sesuai untuk memprediksi nilai observasi baru.
Contoh berikut menunjukkan cara menggunakan model regresi untuk membuat prediksi.
Contoh 1: Membuat prediksi dengan model regresi linier sederhana
Misalkan seorang dokter mengumpulkan data tinggi badan (dalam inci) dan berat badan (dalam pon) dari 50 pasien.
Kemudian disesuaikan dengan model regresi linier sederhana yang menggunakan “berat badan” sebagai variabel prediktor dan “tinggi badan” sebagai variabel respon.
Persamaan regresi yang dipasang adalah:
Ukuran = 32,7830 + 0,2001*(berat)
Setelah memverifikasi bahwa asumsi model regresi linier terpenuhi, dokter menyimpulkan bahwa model tersebut sesuai dengan data.
Model tersebut kemudian dapat digunakan untuk memprediksi tinggi badan pasien baru berdasarkan berat badan mereka.
Misalnya, seorang pasien baru memiliki berat badan 170 pon. Dengan menggunakan model tersebut, kami memperkirakan bahwa pasien ini akan memiliki tinggi badan 66,8 inci:
Tinggi = 32,7830 + 0,2001*(170) = 66,8 inci
Contoh 2: Membuat prediksi dengan model regresi linier berganda
Diasumsikan seorang ekonom mengumpulkan data total tahun pendidikan, jam kerja mingguan, dan pendapatan tahunan 30 orang.
Kemudian model regresi linier berganda dicocokkan dengan menggunakan “jumlah tahun pendidikan” dan “jam kerja mingguan” sebagai variabel prediktor dan “pendapatan tahunan” sebagai variabel respons.
Persamaan regresi yang dipasang adalah:
Pendapatan = 1,342.29 + 3,324.33*(tahun sekolah) + 765.88*(jam kerja mingguan)
Setelah memverifikasi bahwa asumsi model regresi linier terpenuhi, ekonom menyimpulkan bahwa model tersebut sesuai dengan data.
Model tersebut kemudian dapat digunakan untuk memprediksi pendapatan tahunan individu baru berdasarkan total tahun pendidikan dan jam kerja mingguan.
Misalnya, seorang individu baru mempunyai total pendidikan 16 tahun dan bekerja rata-rata 40 jam per minggu. Dengan menggunakan model tersebut, kami memperkirakan bahwa orang ini akan memiliki pendapatan tahunan sebesar $85.166,77:
Pendapatan = 1,342.29 + 3,324.33*(16) + 765.88*(45) = $85,166.77
Tentang penggunaan interval kepercayaan
Saat Anda menggunakan model regresi untuk membuat prediksi tentang observasi baru, nilai yang diprediksi oleh model regresi disebut estimasi titik .
Meskipun estimasi titik mewakili estimasi terbaik kami mengenai nilai observasi baru, kemungkinan besar estimasi tersebut tidak akan sama persis dengan nilai observasi baru.
Jadi, untuk menangkap ketidakpastian ini, kita dapat membuat interval kepercayaan – rentang nilai yang kemungkinan besar memuat parameter populasi dengan tingkat kepercayaan tertentu.
Misalnya, daripada memprediksi bahwa individu baru akan memiliki tinggi 66,8 inci, kita dapat membuat interval kepercayaan berikut:
Interval kepercayaan 95% = [64,8 inci, 68,8 inci]
Kami menafsirkan interval ini berarti bahwa kami yakin 95% bahwa tinggi sebenarnya individu ini adalah antara 64,8 inci dan 68,8 inci.
Tindakan pencegahan yang harus diambil saat membuat prediksi
Ingatlah hal-hal berikut saat menggunakan model regresi untuk membuat prediksi:
1. Gunakan model hanya untuk membuat prediksi dalam rentang data yang digunakan untuk memperkirakan model regresi.
Misalnya, kita sedang memasang model regresi menggunakan variabel prediktor “berat” dan berat individu dalam sampel yang kita gunakan untuk memperkirakan model adalah antara 120 dan 180 pon.
Penggunaan model untuk memperkirakan tinggi seseorang dengan berat 200 pon tidak valid, karena ini berada di luar rentang variabel prediktor yang kami gunakan untuk memperkirakan model.
Ada kemungkinan bahwa hubungan antara berat dan tinggi badan berbeda di luar kisaran 120 hingga 180 pon. Oleh karena itu kita tidak boleh menggunakan model tersebut untuk memperkirakan tinggi seseorang dengan berat 200 pon.
2. Gunakan model tersebut hanya untuk membuat prediksi terhadap populasi yang Anda jadikan sampel.
Misalnya, populasi yang diambil seorang ekonom dari sampel seluruh orang yang tinggal di kota tertentu.
Kita sebaiknya hanya menggunakan model regresi yang sesuai untuk memprediksi pendapatan tahunan individu di kota ini karena seluruh sampel yang digunakan sesuai dengan model yang tinggal di kota ini.
Sumber daya tambahan
Pengantar Regresi Linier Sederhana
Pengantar Regresi Linier Berganda
Pengantar Interval Keyakinan
Empat asumsi regresi linier