O que é considerado um bom valor de aic?
O Critério de Informação de Akaike (AIC) é uma métrica usada para comparar o ajuste de diferentes modelos de regressão.
É calculado da seguinte forma:
AIC = 2K – 2 ln (L)
Ouro:
- K: O número de parâmetros do modelo.
- ln (L) : A probabilidade logarítmica do modelo. Isso nos diz a probabilidade do modelo, dados os dados.
Depois de ajustar vários modelos de regressão, você pode comparar o valor AIC de cada modelo. O modelo com menor AIC proporciona o melhor ajuste.
Uma pergunta que os alunos costumam fazer sobre o AIC é: O que é considerado um bom valor de AIC?
A resposta simples: não há valor para o AIC que possa ser considerado “bom” ou “ruim” porque simplesmente usamos o AIC como forma de comparar modelos de regressão. O modelo com menor AIC proporciona o melhor ajuste. O valor absoluto do valor AIC não é importante.
Por exemplo, se o Modelo 1 tiver um valor AIC de 730,5 e o Modelo 2 tiver um valor AIC de 456,3, então o Modelo 2 fornecerá um melhor ajuste. Os valores absolutos do AIC não são importantes.
Uma referência útil sobre este tópico vem de Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences na página 402:
Tal como acontece com a probabilidade, o valor absoluto do AIC não tem sentido (sendo determinado pela constante arbitrária). Como esta constante depende dos dados, o AIC pode ser usado para comparar modelos ajustados a amostras idênticas.
O melhor modelo entre todos os modelos plausíveis considerados é, portanto, aquele que apresenta o menor valor de AIC (menor perda de informação em comparação com o modelo real).
Conforme afirmado no manual, o valor absoluto do AIC não é importante. Simplesmente usamos os valores de AIC para comparar o ajuste dos modelos e o modelo com o menor valor de AIC é o melhor.
Como determinar se um modelo se ajusta bem a um conjunto de dados
O valor AIC é uma forma útil de determinar qual modelo de regressão melhor se ajusta a um conjunto de dados a partir de uma lista de modelos potenciais, mas na verdade não quantifica quão bem o modelo se ajusta aos dados.
Por exemplo, um modelo de regressão específico pode ter o valor AIC mais baixo entre uma lista de modelos potenciais, mas ainda assim pode ser um modelo mal ajustado.
Para determinar se um modelo se ajusta bem a um conjunto de dados, podemos usar as duas métricas a seguir:
- Cp de Mallows : Uma métrica que quantifica o grau de viés em modelos de regressão.
- R-quadrado ajustado : proporção da variância da variável resposta que pode ser explicada pelas variáveis preditoras do modelo, ajustada pelo número de variáveis preditoras do modelo.
Uma estratégia potencial para escolher o “melhor” modelo de regressão entre vários modelos potenciais é a seguinte:
- Primeiro, identifique o modelo com o menor valor de AIC.
- Em seguida, ajuste esse modelo de regressão aos dados e calcule o Cp de Mallows e o R-quadrado ajustado do modelo para quantificar quão bem ele realmente se ajusta aos dados.
Essa abordagem permite identificar o modelo mais adequado e quantificar quão bem o modelo realmente se ajusta aos dados.
Recursos adicionais
Como interpretar valores negativos de AIC
Como calcular AIC em R
Como calcular AIC em Python