Koefisien regresi terstandarisasi dan tidak terstandarisasi


Regresi linier berganda adalah cara yang berguna untuk mengukur hubungan antara dua atau lebih variabel prediktor dan variabel respons .

Biasanya, saat kita melakukan regresi linier berganda, koefisien regresi yang dihasilkan tidak terstandarisasi , artinya koefisien regresi tersebut menggunakan data mentah untuk menemukan garis yang paling sesuai.

Namun, ketika variabel prediktor diukur pada skala yang sangat berbeda, mungkin berguna untuk melakukan regresi linier berganda menggunakan data standar, sehingga menghasilkan koefisien standar .

Untuk membantu Anda memahami ide ini, mari kita lihat contoh sederhana.

Contoh: Koefisien regresi terstandar dan tidak terstandar

Misalkan kita memiliki kumpulan data berikut yang berisi informasi tentang umur, ukuran luas, dan harga jual 12 rumah:

Misalkan kita kemudian melakukan regresi linier berganda, menggunakan umur dan luas lahan sebagai variabel prediktor dan harga sebagai variabel respon.

Berikut hasil regresinya :

Contoh koefisien regresi tidak terstandarisasi

Koefisien regresi dalam tabel ini tidak terstandarisasi , artinya koefisien tersebut menggunakan data mentah agar sesuai dengan model regresi ini. Pada pandangan pertama, tampaknya usia memiliki pengaruh yang jauh lebih besar terhadap harga real estat karena koefisiennya dalam tabel regresi adalah -409.833 , dibandingkan dengan hanya 100.866 untuk variabel prediktor luas persegi .

Namun, kesalahan standarnya jauh lebih besar untuk usia dibandingkan untuk luas persegi, itulah sebabnya nilai p yang sesuai sebenarnya besar untuk usia (p = 0,520) dan kecil untuk luas persegi (p = 0,000).

Penyebab perbedaan koefisien regresi yang ekstrim adalah karena perbedaan ekstrim skala kedua variabel:

  • Nilai untuk usia berkisar antara 4 hingga 44 tahun.
  • Nilai luas persegi berkisar antara 1.200 hingga 2.800.

Misalkan kita menormalkan data mentah asli dengan mengubah setiap nilai data asli menjadi skor-z:

Standarisasi data di Excel

Jika kemudian kita melakukan regresi linier berganda dengan menggunakan data standar, maka akan diperoleh hasil regresi sebagai berikut:

Koefisien regresi standar

Koefisien regresi dalam tabel ini terstandarisasi , artinya mereka menggunakan data terstandar agar sesuai dengan model regresi ini. Cara menafsirkan koefisien pada tabel adalah sebagai berikut:

  • Peningkatan satu deviasi standar pada usia dikaitkan dengan penurunan deviasi standar pada harga rumah sebesar 0,092 , dengan asumsi luas persegi tetap konstan.
  • Peningkatan satu deviasi standar dalam luas persegi dikaitkan dengan kenaikan deviasi standar pada harga rumah sebesar 0,885 , dengan asumsi usia tetap konstan.

Kita dapat segera melihat bahwa ukuran luas memiliki pengaruh yang jauh lebih besar terhadap harga real estat dibandingkan usia. Perlu diketahui juga bahwa nilai p untuk setiap variabel prediktor sama persis dengan model regresi sebelumnya.

Terkait: Cara Menghitung Z Score di Excel

Kapan menggunakan koefisien regresi terstandarisasi atau tidak terstandarisasi

Koefisien regresi terstandarisasi dan tidak terstandarisasi dapat berguna tergantung pada situasinya. Khususnya:

Koefisien regresi tidak terstandar berguna ketika Anda ingin menafsirkan pengaruh perubahan satu unit dalam variabel prediktor terhadap variabel respons. Pada contoh di atas, kita dapat menggunakan koefisien regresi tidak terstandarisasi dari regresi pertama untuk memahami hubungan pasti antara variabel prediktor dan variabel respons:

  • Peningkatan usia satu unit dikaitkan dengan penurunan harga rumah rata-rata sebesar $409 , dengan asumsi luas persegi tetap konstan. Koefisien ini ternyata tidak signifikan secara statistik (p=0,520).
  • Peningkatan satu unit luas persegi dikaitkan dengan kenaikan rata-rata harga rumah sebesar $100 , dengan asumsi usia tetap konstan. Koefisien ini juga ditemukan signifikan secara statistik (p=0,000).

Koefisien regresi terstandar berguna ketika Anda ingin membandingkan pengaruh berbagai variabel prediktor terhadap variabel respons. Karena setiap variabel distandarisasi, Anda dapat melihat variabel mana yang memiliki pengaruh paling besar terhadap variabel respons.

Kerugian dari koefisien regresi terstandarisasi adalah bahwa koefisien tersebut sedikit lebih sulit untuk diinterpretasikan. Misalnya, lebih mudah untuk memahami pengaruh kenaikan satu unit usia terhadap harga real estat daripada pengaruh kenaikan satu standar deviasi terhadap harga real estat.

Sumber daya tambahan

Cara Membaca dan Menafsirkan Tabel Regresi
Bagaimana menafsirkan koefisien regresi
Cara Melakukan Regresi Linier Berganda di Excel

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *