Cara menghitung bic di r


Kriteria Informasi Bayesian , sering disingkat BIC , adalah ukuran yang digunakan untuk membandingkan kesesuaian model regresi yang berbeda.

Dalam praktiknya, kami menyesuaikan beberapa model regresi ke kumpulan data yang sama dan memilih model dengan nilai BIC terendah sebagai model yang paling sesuai dengan data.

Kami menggunakan rumus berikut untuk menghitung BIC:

BIC: (RSS+log(n)dσ̂ 2 ) / n

Emas:

  • d: Jumlah prediktor
  • n: Jumlah pengamatan
  • σ̂: Estimasi varians kesalahan yang terkait dengan setiap ukuran respons dalam model regresi
  • RSS: Jumlah sisa kuadrat dari model regresi
  • TSS: Jumlah total kuadrat model regresi

Contoh langkah demi langkah berikut menunjukkan cara menghitung nilai BIC untuk model regresi di R.

Langkah 1: Lihat data

Untuk contoh ini, kita akan menggunakan dataset mtcars bawaan:

 #view first six rows of mtcars dataset
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

Langkah 2: Instal Beberapa Template

Selanjutnya, kami akan menyesuaikan beberapa model regresi berbeda menggunakan kumpulan data ini:

 #fit three different regression models
model1 <- lm(mpg ~ disp + hp, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

Langkah 3: Pilih model dengan BIC terendah

Untuk menghitung nilai BIC setiap model, kita dapat menggunakan fungsi BIC() dari paket flexmix :

 library (flexmix)

#calculate BIC of model1
BIC(model1)

[1] 174.4815

#calculate BIC of model2
BIC(model2)

[1] 177.7048

#calculate BIC of model3
BIC(model3)

[1] 170.0307

Kita dapat melihat nilai BIC untuk setiap model:

  • BIC model 1 : 174.4815
  • Model 2 BIC: 177.7048
  • Model 3 BIC: 170.0307

Karena model 3 memiliki nilai BIC terendah, maka kita akan memilihnya sebagai model yang paling sesuai dengan dataset.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menyesuaikan model regresi umum di R:

Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Bagaimana melakukan regresi logistik di R
Bagaimana melakukan regresi kuadrat terkecil tertimbang di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *