適切な aic 値はどれくらいと考えられますか?


赤池情報量基準 (AIC) は、さまざまな回帰モデルの適合度を比較するために使用される指標です。

次のように計算されます。

AIC = 2K – 2 ln (長さ)

金:

  • K:モデルパラメータの数。
  • ln (L) : モデルの対数尤度。これにより、データが与えられた場合にそのモデルがどの程度の可能性を持っているかがわかります。

複数の回帰モデルを適合させたら、各モデルの AIC 値を比較できますAIC が最も低いモデルが最適な適合を提供します。

AIC に関して学生がよく尋ねる質問は、「 AIC の値はどれくらいが良いと考えられますか?」というものです。

簡単な答えは、AIC を回帰モデルを比較する方法として使用しているだけであるため、AIC に「良い」または「悪い」とみなせる値はありません。 AIC が最も低いモデルが最適な適合を提供します。 AIC 値の絶対値は重要ではありません。

たとえば、モデル 1 の AIC 値が 730.5 で、モデル 2 の AIC 値が 456.3 の場合、モデル 2 の方がよりよく適合します。 AIC の絶対値は重要ではありません。

このトピックに関する有用な参考資料は、402 ページの「Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences 」にあります。

尤度の場合と同様、AIC の絶対値はほとんど意味がありません (任意の定数によって決定されます)。この定数はデータに依存するため、AIC を使用して、同一のサンプルに適合したモデルを比較できます。

したがって、考慮されたすべてのもっともらしいモデルの中で最良のモデルは、AIC 値が最も小さい (実際のモデルと比較して情報の損失が最も少ない) モデルとなります。

マニュアルに記載されているように、AIC の絶対値は重要ではありません。 AIC 値を使用してモデルの適合性を比較するだけで、AIC 値が最も低いモデルが最良となります。

モデルがデータセットによく適合しているかどうかを判断する方法

AIC 値は、潜在的なモデルのリストからデータ セットに最も適合する回帰モデルを判断するのに便利な方法ですが、モデルがデータにどの程度適合するかを実際に定量化するものではありません。

たとえば、特定の回帰モデルは、潜在的なモデルのリストの中で最も低い AIC 値を持つ可能性がありますが、それでも適合性が不十分なモデルである可能性があります。

モデルがデータセットによく適合しているかどうかを判断するには、次の 2 つの指標を使用できます。

  • Mallows’ Cp : 回帰モデルの偏りの程度を定量化する指標。
  • 調整済み R 二乗: モデル内の予測子変数の数で調整された、モデル内の予測子変数によって説明できる応答変数の分散の割合。

いくつかの潜在的なモデルの中から「最適な」回帰モデルを選択するための潜在的な戦略は次のとおりです。

  • まず、AIC 値が最も低いモデルを特定します。
  • 次に、この回帰モデルをデータに適合させ、モデルの Mallows Cp と調整済み R 二乗を計算して、実際にデータにどの程度適合するかを定量化します。

このアプローチにより、最適なモデルを特定しそのモデルが実際にデータにどの程度適合するかを定量化できます。

追加リソース

負の AIC 値を解釈する方法
RでAICを計算する方法
Python で AIC を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です