Cara membuat variabel dummy di excel (langkah demi langkah)
Variabel dummy adalah jenis variabel yang kita buat dalam analisis regresi sehingga kita dapat merepresentasikan variabel kategori sebagai variabel numerik yang mengambil salah satu dari dua nilai: nol atau satu.
Misalnya, kita mempunyai kumpulan data berikut dan ingin menggunakan usia dan status perkawinan untuk memprediksi pendapatan :
Untuk menggunakan status perkawinan sebagai variabel prediktor dalam model regresi, kita perlu mengubahnya menjadi variabel dummy.
Karena ini saat ini merupakan variabel kategori yang dapat mengambil tiga nilai berbeda (“Lajang”, “Menikah”, atau “Bercerai”), kita perlu membuat k -1 = 3-1 = 2 variabel tiruan.
Untuk membuat variabel dummy ini, kita dapat membiarkan “Tunggal” sebagai nilai dasar karena variabel ini paling sering muncul. Berikut cara kami mengubah status perkawinan menjadi variabel dummy:
Tutorial ini memberikan contoh langkah demi langkah tentang cara membuat variabel dummy untuk kumpulan data persis ini di Excel dan kemudian melakukan analisis regresi menggunakan variabel dummy tersebut sebagai prediktor.
Langkah 1: Buat datanya
Pertama, mari buat dataset di Excel:
Langkah 2: Buat Variabel Dummy
Selanjutnya, kita bisa menyalin nilai dari kolom A dan B ke kolom E dan F, lalu menggunakan fungsi IF() di Excel untuk mendefinisikan dua variabel dummy baru: Menikah dan Bercerai.
Berikut rumus yang kami gunakan di sel G2 , yang kami salin ke sel lainnya di kolom G:
= IF (C2 = "Married", 1, 0)
Dan inilah rumus yang kami gunakan di sel H2 , yang kami salin ke sel lainnya di kolom H:
= IF (C2 = "Divorced", 1, 0)
Kemudian kita dapat menggunakan variabel dummy tersebut dalam model regresi untuk memprediksi pendapatan.
Langkah 3: Lakukan Regresi Linier
Untuk melakukan regresi linier berganda, kita perlu mengklik tab Data di sepanjang pita atas, lalu klik Analisis Data di bagian Analisis :
Jika opsi ini tidak tersedia, Anda harus memuat Analysis Toolpak terlebih dahulu.
Di jendela yang muncul, klik Regresi lalu klik OK .
Selanjutnya, isi informasi berikut dan klik OK .
Ini menghasilkan hasil sebagai berikut:
Dari hasilnya kita dapat melihat bahwa garis regresi yang dipasang adalah:
Pendapatan = 14,276.12 + 1,471.67*(umur) + 2,479.75*(menikah) – 8,397.40*(bercerai)
Kita dapat menggunakan persamaan ini untuk mengetahui perkiraan pendapatan seseorang berdasarkan usia dan status perkawinannya. Misalnya, seseorang yang berusia 35 tahun dan menikah akan memiliki perkiraan pendapatan sebesar $68,264 :
Pendapatan = 14,276.12 + 1,471.67*(35) + 2,479.75*(1) – 8,397.40*(0) = $68,264
Berikut cara menginterpretasikan koefisien regresi pada tabel:
- Intersep: Intersep mewakili pendapatan rata-rata satu orang berusia nol tahun. Karena seseorang tidak boleh berumur nol tahun, maka tidak masuk akal untuk menafsirkan intersep itu sendiri dalam model regresi khusus ini.
- Usia: Setiap peningkatan usia setiap tahun dikaitkan dengan peningkatan pendapatan rata-rata sebesar $1,471,67. Karena nilai p (0,004) kurang dari 0,05, usia merupakan prediktor pendapatan yang signifikan secara statistik.
- Menikah: Orang yang menikah berpenghasilan rata-rata $2,479,75 lebih banyak daripada satu orang. Karena nilai p (0,800) tidak kurang dari 0,05, perbedaan ini tidak signifikan secara statistik.
- Bercerai: Orang yang bercerai berpenghasilan rata-rata $8,397.40 lebih sedikit dari satu orang. Karena nilai p (0,532) tidak kurang dari 0,05, perbedaan ini tidak signifikan secara statistik.
Karena kedua variabel dummy tersebut tidak signifikan secara statistik, kami dapat menghapus status perkawinan sebagai prediktor dari model, karena hal ini tampaknya tidak menambah nilai prediktif terhadap pendapatan.
Sumber daya tambahan
Cara melakukan regresi linier sederhana di Excel
Cara Menghitung Jumlah Sisa Kuadrat di Excel
Cara Melakukan Regresi Polinomial di Excel
Cara Membuat Plot Sisa di Excel