Как интерпретировать отрицательные значения aic
Информационный критерий Акаике (AIC) — это показатель, используемый для сравнения соответствия различных моделей регрессии.
Он рассчитывается следующим образом:
АИК = 2К – 2 ln (L)
Золото:
- K: Количество параметров модели.
- ln (L) : Логарифмическое правдоподобие модели. Это говорит нам, насколько вероятна модель с учетом данных.
После того как вы подобрали несколько моделей регрессии, вы можете сравнить значение AIC каждой модели. Модель с самым низким AIC обеспечивает наилучшее соответствие.
Студенты часто задают вопрос об AIC: как интерпретировать отрицательные значения AIC?
Простой ответ: чем ниже значение AIC, тем лучше подходит модель. Абсолютное значение значения AIC не имеет значения. Это может быть положительным или отрицательным.
Например, если Модель 1 имеет значение AIC -56,5, а Модель 2 имеет значение AIC -103,3, то Модель 2 обеспечивает лучшее соответствие. Не имеет значения, если оба значения AIC отрицательны.
Понимание отрицательных значений AIC
Легко увидеть, как данная регрессионная модель может привести к отрицательному значению AIC, если мы просто посмотрим на формулу, используемую для расчета AIC:
АИК = 2К – 2 ln (L)
Предположим, у нас есть модель с 7 параметрами и логарифмическим правдоподобием 70.
Мы могли бы рассчитать AIC этой модели следующим образом:
АИК = 2*7 – 2*70 = -126
Затем мы могли бы сравнить это значение AIC со значением других регрессионных моделей, чтобы определить, какая модель лучше всего подходит.
Ссылки на учебники по отрицательным значениям AIC
Полезная ссылка на учебник по отрицательным значениям AIC содержится в книге «Выбор модели и мультимодальный вывод: практический информационно-теоретический подход» на стр. 62:
Обычно AIC положителен; однако его можно сместить на любую аддитивную константу, а некоторые изменения могут привести к отрицательным значениям AIC. Это не абсолютный размер значения AIC, это относительные значения на всех рассмотренных моделях, и в частности различия между значениями AIC важны.
Еще одна полезная ссылка содержится в книге «Серьезная статистика: руководство по расширенной статистике для поведенческих наук» на странице 402:
Как и в случае с правдоподобием, абсолютное значение AIC в значительной степени бессмысленно (определяется произвольной константой). Поскольку эта константа зависит от данных, AIC можно использовать для сравнения моделей, адаптированных к идентичным образцам.
Таким образом, лучшей моделью среди всех рассмотренных правдоподобных моделей является модель с наименьшим значением AIC (наименьшая потеря информации по сравнению с реальной моделью).
Как отмечается в обоих учебниках, абсолютное значение AIC не имеет значения. Мы просто используем значения AIC для сравнения соответствия моделей, и модель с наименьшим значением AIC является лучшей.