Apa yang dianggap sebagai nilai aic yang baik?


Kriteria Informasi Akaike (AIC) adalah metrik yang digunakan untuk membandingkan kesesuaian model regresi yang berbeda.

Ini dihitung sebagai berikut:

AIC = 2K – 2 ln (L)

Emas:

  • K : Jumlah parameter model.
  • ln (L) : Log-likelihood model. Hal ini memberi tahu kita seberapa besar kemungkinan model tersebut, berdasarkan datanya.

Setelah Anda memasang beberapa model regresi, Anda dapat membandingkan nilai AIC setiap model. Model dengan AIC terendah memberikan kesesuaian terbaik.

Pertanyaan yang sering ditanyakan siswa tentang AIC adalah: Apa yang dianggap sebagai nilai AIC yang baik?

Jawaban sederhananya: Tidak ada nilai AIC yang dapat dianggap “baik” atau “buruk” karena kita hanya menggunakan AIC sebagai cara untuk membandingkan model regresi. Model dengan AIC terendah memberikan kesesuaian terbaik. Nilai absolut dari nilai AIC tidak penting.

Misalnya, jika Model 1 memiliki nilai AIC sebesar 730,5 dan Model 2 memiliki nilai AIC sebesar 456,3, maka Model 2 memberikan kesesuaian yang lebih baik. Nilai absolut AIC tidak penting.

Referensi yang berguna mengenai topik ini berasal dari Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences di halaman 402:

Seperti halnya kemungkinan, nilai absolut AIC sebagian besar tidak ada artinya (ditentukan oleh konstanta arbitrer). Karena konstanta ini bergantung pada data, AIC dapat digunakan untuk membandingkan model yang dipasang pada sampel yang identik.

Oleh karena itu, model terbaik di antara semua model yang masuk akal yang dipertimbangkan adalah model yang memiliki nilai AIC terkecil (kehilangan informasi paling kecil dibandingkan model sebenarnya).

Sebagaimana dinyatakan dalam manual, nilai absolut AIC tidak penting. Kita cukup menggunakan nilai AIC untuk membandingkan kecocokan model dan model dengan nilai AIC terendah adalah yang terbaik.

Cara menentukan apakah suatu model cocok dengan kumpulan data

Nilai AIC adalah cara yang berguna untuk menentukan model regresi mana yang paling cocok dengan kumpulan data dari daftar model potensial, namun nilai AIC tidak benar-benar mengukur seberapa cocok model tersebut dengan data.

Misalnya, model regresi tertentu mungkin memiliki nilai AIC terendah di antara daftar model potensial, namun model tersebut mungkin masih merupakan model yang kurang sesuai.

Untuk menentukan apakah suatu model cocok dengan kumpulan data, kita dapat menggunakan dua metrik berikut:

  • Mallows’ Cp : Metrik yang mengukur tingkat bias dalam model regresi.
  • Adjusted R-squared : proporsi varians variabel respon yang dapat dijelaskan oleh variabel prediktor dalam model, disesuaikan dengan jumlah variabel prediktor dalam model.

Strategi potensial untuk memilih model regresi “terbaik” di antara beberapa model potensial adalah sebagai berikut:

  • Pertama, identifikasi model dengan nilai AIC terendah.
  • Kemudian sesuaikan model regresi ini dengan data dan hitung Mallows Cp dan R-squared yang disesuaikan dari model tersebut untuk mengukur seberapa cocok model tersebut dengan data.

Pendekatan ini memungkinkan Anda mengidentifikasi model yang paling sesuai dan mengukur seberapa cocok model tersebut dengan data.

Sumber daya tambahan

Bagaimana menafsirkan nilai AIC negatif
Cara menghitung AIC di R
Cara Menghitung AIC dengan Python

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *