R multiple atau r square: apa bedanya?


Saat Anda menyesuaikan model regresi menggunakan sebagian besar perangkat lunak statistik, Anda akan sering melihat dua nilai berikut pada hasilnya:

Multiple R: koefisien korelasi berganda antara tiga variabel atau lebih.

R-Square: Ini dihitung sebagai (Multiple R) 2 dan mewakili proporsi varians variabel respon model regresi yang dapat dijelaskan oleh variabel prediktor. Nilai ini bervariasi dari 0 hingga 1.

Dalam praktiknya, kita sering kali tertarik pada nilai R-kuadrat karena nilai tersebut menunjukkan seberapa berguna variabel prediktor dalam memprediksi nilai variabel respons.

Namun, setiap kali kita menambahkan variabel prediktor baru ke dalam model, R-squared dijamin akan meningkat meskipun variabel prediktor tidak berguna.

R-squared yang disesuaikan adalah versi modifikasi dari R-squared yang menyesuaikan jumlah prediktor dalam model regresi. Ini dihitung sebagai berikut:

Disesuaikan R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

Emas:

  • R 2 : R 2 model
  • n : Jumlah pengamatan
  • k : Banyaknya variabel prediktor

Karena R-kuadrat selalu meningkat seiring Anda menambahkan lebih banyak prediktor ke model, R-kuadrat yang disesuaikan dapat berfungsi sebagai metrik yang memberi tahu Anda seberapa berguna suatu model, disesuaikan berdasarkan jumlah prediktor dalam suatu model .

Untuk lebih memahami masing-masing istilah tersebut, perhatikan contoh berikut.

Contoh: Kelipatan R, R-kuadrat, dan R-kuadrat yang disesuaikan

Misalkan kita memiliki kumpulan data berikut yang berisi tiga variabel berikut untuk 12 siswa berbeda:

Misalkan kita memasang model regresi linier berganda dengan menggunakan jam belajar dan nilai saat ini sebagai variabel prediktor dan nilai ujian sebagai variabel respon dan memperoleh hasil sebagai berikut:

Beberapa R versus R-kuadrat

Kita dapat mengamati nilai dari tiga metrik berikut:

Kelipatan R : 0,978 . Ini mewakili korelasi ganda antara variabel respon dan dua variabel prediktor.

R Persegi: 0,956 . Ini dihitung sebagai (Kelipatan R) 2 = (0,978) 2 = 0,956. Hal ini menunjukkan bahwa 95,6% variasi nilai ujian dapat dijelaskan oleh jumlah jam yang dihabiskan siswa untuk belajar dan nilai mereka saat ini dalam mata pelajaran tersebut.

R-kuadrat yang disesuaikan: 0,946 . Ini dihitung sebagai berikut:

Disesuaikan R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0,946.

Ini mewakili nilai R-kuadrat yang disesuaikan dengan jumlah variabel prediktor dalam model .

Ukuran ini akan berguna jika, misalnya, kita menyesuaikan model regresi lain dengan 10 prediktor dan menemukan bahwa R-kuadrat yang disesuaikan dari model tersebut adalah 0,88 . Hal ini menunjukkan bahwa model regresi dengan dua prediktor saja lebih baik karena memiliki nilai R square yang disesuaikan lebih tinggi.

Sumber daya tambahan

Pengantar Regresi Linier Berganda
Berapa nilai R-kuadrat yang bagus?

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *