Qual è considerato un buon valore aic?


L’Akaike Information Criterion (AIC) è una metrica utilizzata per confrontare l’adattamento di diversi modelli di regressione.

Viene calcolato come segue:

AIC = 2K – 2 ln (L)

Oro:

  • K: il numero di parametri del modello.
  • ln (L) : la log-verosimiglianza del modello. Questo ci dice quanto è probabile il modello, dati i dati.

Dopo aver adattato più modelli di regressione, è possibile confrontare il valore AIC di ciascun modello. Il modello con l’AIC più basso fornisce la soluzione migliore.

Una domanda che gli studenti spesso pongono sull’AIC è: cosa è considerato un buon valore AIC?

La risposta è semplice: non esiste un valore per l’AIC che possa essere considerato “buono” o “cattivo” perché utilizziamo semplicemente l’AIC come metodo per confrontare modelli di regressione. Il modello con l’AIC più basso fornisce la soluzione migliore. Il valore assoluto del valore AIC non è importante.

Ad esempio, se il Modello 1 ha un valore AIC di 730,5 e il Modello 2 ha un valore AIC di 456,3, il Modello 2 fornisce un adattamento migliore. I valori assoluti di AIC non sono importanti.

Un riferimento utile su questo argomento viene da Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences a pagina 402:

Come nel caso della probabilità, il valore assoluto dell’AIC è in gran parte privo di significato (essendo determinato dalla costante arbitraria). Poiché questa costante dipende dai dati, l’AIC può essere utilizzata per confrontare modelli adattati a campioni identici.

Il modello migliore tra tutti i modelli plausibili considerati è quindi quello con il valore AIC più piccolo (la minore perdita di informazioni rispetto al modello reale).

Come indicato nel manuale, il valore assoluto dell’AIC non è importante. Utilizziamo semplicemente i valori AIC per confrontare l’adattamento dei modelli e il modello con il valore AIC più basso è il migliore.

Come determinare se un modello si adatta bene a un set di dati

Il valore AIC è un modo utile per determinare quale modello di regressione si adatta meglio a un set di dati da un elenco di potenziali modelli, ma in realtà non quantifica quanto bene il modello si adatta ai dati.

Ad esempio, un particolare modello di regressione potrebbe avere il valore AIC più basso tra un elenco di modelli potenziali, ma potrebbe comunque essere un modello poco appropriato.

Per determinare se un modello si adatta bene a un set di dati, possiamo utilizzare le due metriche seguenti:

  • Cp di Mallows : una metrica che quantifica il grado di distorsione nei modelli di regressione.
  • R quadrato corretto : proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili predittive nel modello, corretta per il numero di variabili predittive nel modello.

Una potenziale strategia per scegliere il modello di regressione “migliore” tra diversi modelli potenziali è la seguente:

  • Innanzitutto, identificare il modello con il valore AIC più basso.
  • Quindi adattare questo modello di regressione ai dati e calcolare il Cp di Mallow e l’R quadrato corretto del modello per quantificare quanto bene si adatta effettivamente ai dati.

Questo approccio consente di identificare il modello più adatto e quantificare il grado di adattamento effettivo del modello ai dati.

Risorse addizionali

Come interpretare i valori AIC negativi
Come calcolare l’AIC in R
Come calcolare l’AIC in Python

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *