Como interpretar valores negativos de aic
O Critério de Informação de Akaike (AIC) é uma métrica usada para comparar o ajuste de diferentes modelos de regressão.
É calculado da seguinte forma:
AIC = 2K – 2 ln (L)
Ouro:
- K: O número de parâmetros do modelo.
- ln (L) : A probabilidade logarítmica do modelo. Isso nos diz a probabilidade do modelo, dados os dados.
Depois de ajustar vários modelos de regressão, você pode comparar o valor AIC de cada modelo. O modelo com menor AIC proporciona o melhor ajuste.
Uma pergunta que os alunos costumam fazer sobre o AIC é: como interpretar valores negativos do AIC?
A resposta simples: quanto menor o valor do AIC, melhor será o ajuste do modelo. O valor absoluto do valor AIC não é importante. Isso pode ser positivo ou negativo.
Por exemplo, se o Modelo 1 tiver um valor AIC de -56,5 e o Modelo 2 tiver um valor AIC de -103,3, então o Modelo 2 fornecerá um melhor ajuste. Não importa se ambos os valores de AIC são negativos.
Compreendendo os valores negativos do AIC
É fácil ver como um determinado modelo de regressão poderia resultar em um valor negativo de AIC se simplesmente observarmos a fórmula usada para calcular o AIC:
AIC = 2K – 2 ln (L)
Suponha que temos um modelo com 7 parâmetros e uma probabilidade logarítmica de 70.
Calcularíamos o AIC deste modelo da seguinte forma:
AIC = 2*7 – 2*70 = -126
Poderíamos então comparar esse valor AIC com o de outros modelos de regressão para determinar qual modelo fornece o melhor ajuste.
Referências de livros didáticos sobre valores negativos de AIC
Uma referência útil de livro sobre valores negativos de AIC vem de Model Selection and Multimodal Inference: A Practical Information-Theoretic Approach na página 62:
Normalmente o AIC é positivo; no entanto, pode ser alterado por qualquer constante aditiva, e algumas alterações podem resultar em valores AIC negativos… Este não é o tamanho absoluto do valor AIC, são os valores relativos em todos os modelos considerados, e em particular as diferenças entre os valores AIC, é importante.
Outra referência útil vem de Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences na página 402:
Tal como acontece com a probabilidade, o valor absoluto do AIC não tem sentido (sendo determinado pela constante arbitrária). Como esta constante depende dos dados, o AIC pode ser usado para comparar modelos ajustados a amostras idênticas.
O melhor modelo entre todos os modelos plausíveis considerados é, portanto, aquele que apresenta o menor valor de AIC (menor perda de informação em comparação com o modelo real).
Conforme observado em ambos os livros didáticos, o valor absoluto do AIC não é importante. Simplesmente usamos os valores de AIC para comparar o ajuste dos modelos e o modelo com o menor valor de AIC é o melhor.