什么是嵌套模型? (定义&;示例)
嵌套模型只是一个回归模型,其中包含另一个回归模型中的预测变量子集。
例如,假设我们有以下回归模型(我们称之为模型 A),它根据四个预测变量来预测篮球运动员的得分:
积分 = β 0 + β 1 (分钟)+ β 2 (高度)+ β 3 (位置)+ β 4 (射门)+ ε
嵌套模型(我们称之为模型 B)的一个示例是以下模型,其中仅包含模型 A 中的两个预测变量:
积分 = β 0 + β 1 (分钟)+ β 2 (高度)+ ε
我们会说模型 B 嵌套在模型 A 中,因为模型 B 包含模型 A 的预测变量的子集。
但是,考虑一下我们是否有另一个包含三个预测变量的模型(我们称之为模型 C):
得分 = β 0 + β 1 (分钟)+ β 2 (身高)+ β 3 (罚球次数)
我们不会说模型 C 嵌套在模型 A 中,因为每个模型都包含另一个模型不包含的预测变量。
嵌套模型的重要性
当我们想知道具有完整预测变量集的模型是否比具有这些预测变量子集的模型更好地拟合数据集时,我们在实践中经常使用嵌套模型。
例如,在上面的场景中,我们可以使用上场时间、身高、位置和投篮次数来拟合一个综合模型来预测篮球运动员的得分。
然而,我们可能怀疑位置和出手次数可能无法很好地预测得分。
因此,我们可以拟合一个嵌套模型,该模型仅使用比赛时间和球场来预测得分。
然后我们可以比较这两个模型以确定是否存在统计上的显着差异。
如果模型之间没有显着差异,我们可以删除位置和尝试的投篮作为预测变量,因为它们不会显着改善模型。
如何解析嵌套模型
为了确定嵌套模型是否与“完整”模型显着不同,我们通常执行使用以下零假设和替代假设的似然比检验:
H 0 :完整模型和嵌套模型同样适合数据。所以,你应该使用嵌套模型。
H A :完整模型比嵌套模型更适合数据。所以你必须使用完整的模板。
似然比检验产生卡方检验统计量和相应的 p 值。
如果检验的p 值低于一定的显着性水平(例如 0.05),那么我们可以拒绝零假设并得出结论:完整模型提供了明显更好的拟合。
以下教程说明如何使用 R 和 Python 执行似然比检验: