Come interpretare i valori aic negativi
L’Akaike Information Criterion (AIC) è una metrica utilizzata per confrontare l’adattamento di diversi modelli di regressione.
Viene calcolato come segue:
AIC = 2K – 2 ln (L)
Oro:
- K: il numero di parametri del modello.
- ln (L) : la log-verosimiglianza del modello. Questo ci dice quanto è probabile il modello, dati i dati.
Dopo aver adattato più modelli di regressione, è possibile confrontare il valore AIC di ciascun modello. Il modello con l’AIC più basso fornisce la soluzione migliore.
Una domanda che gli studenti spesso pongono sull’AIC è: come interpretare i valori AIC negativi?
La risposta è semplice: più basso è il valore AIC, migliore è il modello. Il valore assoluto del valore AIC non è importante. Questo può essere positivo o negativo.
Ad esempio, se il Modello 1 ha un valore AIC pari a -56,5 e il Modello 2 ha un valore AIC pari a -103,3, il Modello 2 fornisce un adattamento migliore. Non importa se entrambi i valori AIC sono negativi.
Comprendere i valori AIC negativi
È facile vedere come un dato modello di regressione potrebbe risultare in un valore AIC negativo se guardiamo semplicemente la formula utilizzata per calcolare l’AIC:
AIC = 2K – 2 ln (L)
Supponiamo di avere un modello con 7 parametri e una log-verosimiglianza di 70.
Calcoleremo l’AIC di questo modello come segue:
AIC = 2*7 – 2*70 = -126
Potremmo quindi confrontare questo valore AIC con quello di altri modelli di regressione per determinare quale modello fornisce la soluzione migliore.
Riferimenti di libri di testo sui valori AIC negativi
Un utile riferimento ai libri di testo sui valori AIC negativi proviene da Model Selection and Multimodal Inference: A Practical Information-Theoretic Approach a pagina 62:
Solitamente l’AIC è positivo; tuttavia, può essere spostato da qualsiasi costante additiva e alcune modifiche possono comportare valori AIC negativi… Questa non è la dimensione assoluta del valore AIC, sono i valori relativi su tutti i modelli considerati, e in particolare le differenze tra i valori AIC, è importante.
Un altro riferimento utile viene da Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences a pagina 402:
Come nel caso della probabilità, il valore assoluto dell’AIC è in gran parte privo di significato (essendo determinato dalla costante arbitraria). Poiché questa costante dipende dai dati, l’AIC può essere utilizzata per confrontare modelli adattati a campioni identici.
Il modello migliore tra tutti i modelli plausibili considerati è quindi quello con il valore AIC più piccolo (la minore perdita di informazioni rispetto al modello reale).
Come notato in entrambi i libri di testo, il valore assoluto dell’AIC non è importante. Utilizziamo semplicemente i valori AIC per confrontare l’adattamento dei modelli e il modello con il valore AIC più basso è il migliore.