什么被认为是良好的 aic 值?
赤池信息准则 (AIC) 是一种用于比较不同回归模型拟合程度的指标。
计算方法如下:
AIC = 2K – 2 ln (L)
金子:
- K:模型参数的数量。
- ln (L) :模型的对数似然。这告诉我们在给定数据的情况下该模型的可能性有多大。
拟合多个回归模型后,您可以比较每个模型的 AIC 值。 AIC 最低的模型提供最佳拟合。
学生经常问的关于 AIC 的一个问题是:什么才是好的 AIC 值?
简单的答案:AIC 没有任何价值可以被认为是“好”或“坏”,因为我们只是使用 AIC 作为比较回归模型的一种方式。 AIC 最低的模型提供最佳拟合。 AIC值的绝对值并不重要。
例如,如果模型 1 的 AIC 值为 730.5,模型 2 的 AIC 值为 456.3,则模型 2 提供更好的拟合。 AIC的绝对值并不重要。
关于此主题的有用参考来自Serious Stats: A Guide to Advanced Statistics for the Behavioural Sciences第 402 页:
与似然一样,AIC 的绝对值在很大程度上没有意义(由任意常数确定)。由于该常数依赖于数据,因此 AIC 可用于比较适用于相同样本的模型。
因此,在所有考虑的合理模型中,最好的模型是 AIC 值最小的模型(与真实模型相比,信息损失最少)。
正如手册中所述,AIC 的绝对值并不重要。我们简单地用AIC值来比较模型的拟合度,AIC值最低的模型是最好的。
如何确定模型是否适合数据集
AIC 值是从潜在模型列表中确定哪种回归模型最适合数据集的有用方法,但它实际上并不能量化模型对数据的拟合程度。
例如,特定回归模型可能在潜在模型列表中具有最低的 AIC 值,但它可能仍然是拟合效果不佳的模型。
为了确定模型是否很好地适合数据集,我们可以使用以下两个指标:
- Mallows’ Cp :量化回归模型偏差程度的指标。
- 调整后的 R 平方:响应变量中可由模型中的预测变量解释的方差比例,根据模型中预测变量的数量进行调整。
在几个潜在模型中选择“最佳”回归模型的潜在策略如下:
- 首先,确定 AIC 值最低的模型。
- 然后将此回归模型与数据进行拟合,并计算模型的 Mallows Cp 和调整后的 R 平方,以量化其实际与数据的拟合程度。
通过这种方法,您可以识别最适合的模型并量化模型与数据的实际拟合程度。