Що вважається хорошим значенням aic?


Інформаційний критерій Akaike (AIC) — це показник, який використовується для порівняння відповідності різних регресійних моделей.

Він розраховується таким чином:

AIC = 2K – 2 ln (L)

золото:

  • K: Кількість параметрів моделі.
  • ln (L) : логарифм правдоподібності моделі. Це говорить нам про те, наскільки ймовірною є модель, враховуючи дані.

Після встановлення кількох регресійних моделей ви можете порівняти значення AIC кожної моделі. Модель з найнижчим AIC забезпечує найкраще прилягання.

Питання, яке студенти часто задають про AIC: що вважається хорошим значенням AIC?

Проста відповідь: для AIC немає значення, яке можна вважати «хорошим» або «поганим», оскільки ми просто використовуємо AIC як спосіб порівняння регресійних моделей. Модель з найнижчим AIC забезпечує найкраще прилягання. Абсолютне значення значення AIC не має значення.

Наприклад, якщо модель 1 має значення AIC 730,5, а модель 2 має значення AIC 456,3, тоді модель 2 забезпечує кращу відповідність. Абсолютні значення AIC не важливі.

Корисна довідка на цю тему міститься в Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences на сторінці 402:

Як і у випадку з ймовірністю, абсолютне значення AIC є значною мірою безглуздим (визначається довільною константою). Оскільки ця константа залежить від даних, AIC можна використовувати для порівняння моделей, підігнаних до ідентичних зразків.

Тому найкращою моделлю серед усіх розглянутих правдоподібних є та, яка має найменше значення AIC (найменша втрата інформації порівняно з реальною моделлю).

Як зазначено в посібнику, абсолютне значення AIC не має значення. Ми просто використовуємо значення AIC, щоб порівняти відповідність моделей, і модель з найнижчим значенням AIC є найкращою.

Як визначити, чи добре модель відповідає набору даних

Значення AIC — це корисний спосіб визначити, яка регресійна модель найкраще відповідає набору даних зі списку потенційних моделей, але воно фактично не визначає , наскільки добре модель відповідає даним.

Наприклад, конкретна регресійна модель може мати найнижче значення AIC серед списку потенційних моделей, але все одно вона може бути погано підходящою моделлю.

Щоб визначити, чи добре модель відповідає набору даних, ми можемо використовувати такі два показники:

  • Cp Маллоуза : метрика, яка кількісно визначає ступінь зміщення в регресійних моделях.
  • Скоригований R-квадрат : частка дисперсії у змінній відповіді, яку можна пояснити змінними предикторів у моделі, скоригована на кількість змінних предикторів у моделі.

Потенційна стратегія вибору «найкращої» регресійної моделі серед кількох потенційних моделей така:

  • Спочатку визначте модель із найнижчим значенням AIC.
  • Потім підберіть цю модель регресії до даних і обчисліть Cp Маллоуза та скоригований R-квадрат моделі, щоб кількісно визначити, наскільки добре вона насправді відповідає даним.

Цей підхід дозволяє визначити модель, яка найкраще підходить , і кількісно визначити, наскільки модель насправді відповідає даним.

Додаткові ресурси

Як інтерпретувати негативні значення AIC
Як розрахувати AIC в R
Як розрахувати AIC в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *