Was gilt als guter aic-wert?
Das Akaike Information Criterion (AIC) ist eine Metrik, die zum Vergleich der Passung verschiedener Regressionsmodelle verwendet wird.
Es wird wie folgt berechnet:
AIC = 2K – 2 ln (L)
Gold:
- K: Die Anzahl der Modellparameter.
- ln (L) : Die Log-Likelihood des Modells. Dies sagt uns, wie wahrscheinlich das Modell angesichts der Daten ist.
Nachdem Sie mehrere Regressionsmodelle angepasst haben, können Sie den AIC-Wert jedes Modells vergleichen. Das Modell mit dem niedrigsten AIC bietet die beste Passform.
Eine von Studierenden häufig gestellte Frage zum AIC lautet: Was gilt als guter AIC-Wert?
Die einfache Antwort: Es gibt keinen Wert für AIC, der als „gut“ oder „schlecht“ angesehen werden kann, da wir AIC lediglich zum Vergleich von Regressionsmodellen verwenden. Das Modell mit dem niedrigsten AIC bietet die beste Passform. Der absolute Wert des AIC-Wertes ist nicht wichtig.
Wenn beispielsweise Modell 1 einen AIC-Wert von 730,5 und Modell 2 einen AIC-Wert von 456,3 hat, dann bietet Modell 2 eine bessere Anpassung. Absolute Werte des AIC sind nicht wichtig.
Eine nützliche Referenz zu diesem Thema stammt aus Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences auf Seite 402:
Wie bei der Wahrscheinlichkeit ist der absolute Wert des AIC weitgehend bedeutungslos (er wird durch die willkürliche Konstante bestimmt). Da diese Konstante datenabhängig ist, kann AIC zum Vergleich von Modellen verwendet werden, die an identische Stichproben angepasst wurden.
Das beste Modell unter allen betrachteten plausiblen Modellen ist daher dasjenige mit dem kleinsten AIC-Wert (dem geringsten Informationsverlust im Vergleich zum realen Modell).
Wie im Handbuch angegeben, ist der absolute Wert des AIC nicht wichtig. Wir verwenden einfach die AIC-Werte, um die Anpassung der Modelle zu vergleichen, und das Modell mit dem niedrigsten AIC-Wert ist das beste.
So ermitteln Sie, ob ein Modell gut zu einem Datensatz passt
Der AIC-Wert ist eine nützliche Methode, um aus einer Liste potenzieller Modelle zu bestimmen, welches Regressionsmodell am besten zu einem Datensatz passt. Er quantifiziert jedoch nicht wirklich , wie gut das Modell zu den Daten passt.
Beispielsweise kann ein bestimmtes Regressionsmodell den niedrigsten AIC-Wert in einer Liste potenzieller Modelle haben, aber es kann dennoch ein schlecht passendes Modell sein.
Um festzustellen, ob ein Modell gut zu einem Datensatz passt, können wir die folgenden zwei Metriken verwenden:
- Mallows‘ Cp : Eine Metrik, die den Grad der Verzerrung in Regressionsmodellen quantifiziert.
- Angepasstes R-Quadrat : Anteil der Varianz in der Antwortvariablen, der durch die Prädiktorvariablen im Modell erklärt werden kann, angepasst an die Anzahl der Prädiktorvariablen im Modell.
Eine mögliche Strategie zur Auswahl des „besten“ Regressionsmodells aus mehreren potenziellen Modellen sieht wie folgt aus:
- Identifizieren Sie zunächst das Modell mit dem niedrigsten AIC-Wert.
- Passen Sie dann dieses Regressionsmodell an die Daten an und berechnen Sie den Mallows-Cp und das angepasste R-Quadrat des Modells, um zu quantifizieren, wie gut es tatsächlich zu den Daten passt.
Mit diesem Ansatz können Sie das am besten passende Modell identifizieren und quantifizieren, wie gut das Modell tatsächlich zu den Daten passt.
Zusätzliche Ressourcen
Wie man negative AIC-Werte interpretiert
So berechnen Sie den AIC in R
So berechnen Sie AIC in Python