Что считается хорошим значением aic?


Информационный критерий Акаике (AIC) — это показатель, используемый для сравнения соответствия различных моделей регрессии.

Он рассчитывается следующим образом:

АИК = 2К – 2 ln (L)

Золото:

  • K: Количество параметров модели.
  • ln (L) : Логарифмическое правдоподобие модели. Это говорит нам о том, насколько вероятна модель с учетом данных.

После того как вы подобрали несколько моделей регрессии, вы можете сравнить значение AIC каждой модели. Модель с самым низким AIC обеспечивает наилучшее соответствие.

Студенты часто задают вопрос об AIC: Что считается хорошим значением AIC?

Простой ответ: у AIC нет ценности, которую можно было бы считать «хорошей» или «плохой», потому что мы просто используем AIC как способ сравнения регрессионных моделей. Модель с самым низким AIC обеспечивает наилучшее соответствие. Абсолютное значение значения AIC не имеет значения.

Например, если Модель 1 имеет значение AIC 730,5, а Модель 2 имеет значение AIC 456,3, то Модель 2 обеспечивает лучшее соответствие. Абсолютные значения AIC не имеют значения.

Полезную ссылку на эту тему можно найти в книге «Серьезная статистика: руководство по расширенной статистике для поведенческих наук» на странице 402:

Как и в случае с правдоподобием, абсолютное значение AIC в значительной степени бессмысленно (определяется произвольной константой). Поскольку эта константа зависит от данных, AIC можно использовать для сравнения моделей, адаптированных к идентичным образцам.

Таким образом, лучшей моделью среди всех рассмотренных правдоподобных моделей является модель с наименьшим значением AIC (наименьшая потеря информации по сравнению с реальной моделью).

Как указано в инструкции, абсолютное значение AIC не имеет значения. Мы просто используем значения AIC для сравнения соответствия моделей, и модель с наименьшим значением AIC является лучшей.

Как определить, хорошо ли модель соответствует набору данных

Значение AIC — это полезный способ определить, какая модель регрессии лучше всего соответствует набору данных из списка потенциальных моделей, но на самом деле оно не дает количественной оценки того, насколько хорошо модель соответствует данным.

Например, конкретная регрессионная модель может иметь самое низкое значение AIC среди списка потенциальных моделей, но она все равно может быть плохо подходящей моделью.

Чтобы определить, хорошо ли модель соответствует набору данных, мы можем использовать следующие две метрики:

  • Cp Маллоуза : показатель, который количественно определяет степень систематической ошибки в регрессионных моделях.
  • Скорректированный R-квадрат : доля дисперсии переменной отклика, которую можно объяснить переменными-предикторами в модели, с поправкой на количество переменных-предикторов в модели.

Потенциальная стратегия выбора «лучшей» модели регрессии среди нескольких потенциальных моделей заключается в следующем:

  • Сначала определите модель с наименьшим значением AIC.
  • Затем адаптируйте эту модель регрессии к данным и рассчитайте Cp Маллоуса и скорректируйте R-квадрат модели, чтобы количественно определить, насколько хорошо она фактически соответствует данным.

Этот подход позволяет определить наиболее подходящую модель и количественно оценить, насколько хорошо модель фактически соответствует данным.

Дополнительные ресурсы

Как интерпретировать отрицательные значения AIC
Как рассчитать AIC в R
Как рассчитать AIC в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *