Como interpretar valores negativos de aic


O Critério de Informação de Akaike (AIC) é uma métrica usada para comparar o ajuste de diferentes modelos de regressão.

É calculado da seguinte forma:

AIC = 2K – 2 ln (L)

Ouro:

  • K: O número de parâmetros do modelo.
  • ln (L) : A probabilidade logarítmica do modelo. Isso nos diz a probabilidade do modelo, dados os dados.

Depois de ajustar vários modelos de regressão, você pode comparar o valor AIC de cada modelo. O modelo com menor AIC proporciona o melhor ajuste.

Uma pergunta que os alunos costumam fazer sobre o AIC é: como interpretar valores negativos do AIC?

A resposta simples: quanto menor o valor do AIC, melhor será o ajuste do modelo. O valor absoluto do valor AIC não é importante. Isso pode ser positivo ou negativo.

Por exemplo, se o Modelo 1 tiver um valor AIC de -56,5 e o Modelo 2 tiver um valor AIC de -103,3, então o Modelo 2 fornecerá um melhor ajuste. Não importa se ambos os valores de AIC são negativos.

Compreendendo os valores negativos do AIC

É fácil ver como um determinado modelo de regressão poderia resultar em um valor negativo de AIC se simplesmente observarmos a fórmula usada para calcular o AIC:

AIC = 2K – 2 ln (L)

Suponha que temos um modelo com 7 parâmetros e uma probabilidade logarítmica de 70.

Calcularíamos o AIC deste modelo da seguinte forma:

AIC = 2*7 – 2*70 = -126

Poderíamos então comparar esse valor AIC com o de outros modelos de regressão para determinar qual modelo fornece o melhor ajuste.

Referências de livros didáticos sobre valores negativos de AIC

Uma referência útil de livro sobre valores negativos de AIC vem de Model Selection and Multimodal Inference: A Practical Information-Theoretic Approach na página 62:

Normalmente o AIC é positivo; no entanto, pode ser alterado por qualquer constante aditiva, e algumas alterações podem resultar em valores AIC negativos… Este não é o tamanho absoluto do valor AIC, são os valores relativos em todos os modelos considerados, e em particular as diferenças entre os valores AIC, é importante.

Outra referência útil vem de Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences na página 402:

Tal como acontece com a probabilidade, o valor absoluto do AIC não tem sentido (sendo determinado pela constante arbitrária). Como esta constante depende dos dados, o AIC pode ser usado para comparar modelos ajustados a amostras idênticas.

O melhor modelo entre todos os modelos plausíveis considerados é, portanto, aquele que apresenta o menor valor de AIC (menor perda de informação em comparação com o modelo real).

Conforme observado em ambos os livros didáticos, o valor absoluto do AIC não é importante. Simplesmente usamos os valores de AIC para comparar o ajuste dos modelos e o modelo com o menor valor de AIC é o melhor.

Recursos adicionais

Como calcular AIC em R
Como calcular AIC em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *