Як інтерпретувати негативні значення aic


Інформаційний критерій Akaike (AIC) — це показник, який використовується для порівняння відповідності різних регресійних моделей.

Він розраховується таким чином:

AIC = 2K – 2 ln (L)

золото:

  • K: Кількість параметрів моделі.
  • ln (L) : логарифм правдоподібності моделі. Це говорить нам про те, наскільки ймовірною є модель, враховуючи дані.

Після встановлення кількох регресійних моделей ви можете порівняти значення AIC кожної моделі. Модель з найнижчим AIC забезпечує найкраще прилягання.

Питання, яке студенти часто задають щодо AIC: як інтерпретувати негативні значення AIC?

Проста відповідь: чим менше значення AIC, тим краще підходить модель. Абсолютне значення значення AIC не має значення. Це може бути позитивним або негативним.

Наприклад, якщо модель 1 має значення AIC -56,5, а модель 2 має значення AIC -103,3, тоді модель 2 забезпечує кращу відповідність. Немає значення, якщо обидва значення AIC негативні.

Розуміння негативних значень AIC

Легко зрозуміти, як задана регресійна модель може призвести до негативного значення AIC, якщо ми просто подивимося на формулу, яка використовується для розрахунку AIC:

AIC = 2K – 2 ln (L)

Припустимо, ми маємо модель із 7 параметрами та логарифмічної ймовірністю 70.

Ми б розрахували AIC цієї моделі таким чином:

AIC = 2*7 – 2*70 = -126

Потім ми могли б порівняти це значення AIC із значенням інших регресійних моделей, щоб визначити, яка модель найкраще підходить.

Посилання на підручники щодо негативних значень AIC

Корисна підручна довідка про від’ємні значення AIC походить від Вибору моделі та мультимодального висновку: Практичний інформаційно-теоретичний підхід на сторінці 62:

Зазвичай AIC позитивний; однак його можна змінити на будь-яку адитивну константу, і деякі зміни можуть призвести до негативних значень AIC… Це не абсолютний розмір значення AIC, це відносні значення для всіх розглянутих моделей, і зокрема відмінності між значеннями AIC, це важливо.

Інше корисне посилання міститься в Серйозній статистиці: Посібник із передової статистики для поведінкових наук на сторінці 402:

Як і у випадку з ймовірністю, абсолютне значення AIC є значною мірою безглуздим (визначається довільною константою). Оскільки ця константа залежить від даних, AIC можна використовувати для порівняння моделей, підігнаних до ідентичних зразків.

Тому найкращою моделлю серед усіх розглянутих правдоподібних є та, яка має найменше значення AIC (найменша втрата інформації порівняно з реальною моделлю).

Як зазначено в обох підручниках, абсолютне значення AIC не є важливим. Ми просто використовуємо значення AIC, щоб порівняти відповідність моделей, і модель з найнижчим значенням AIC є найкращою.

Додаткові ресурси

Як розрахувати AIC в R
Як розрахувати AIC в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *