什么是阶段性选拔？（解释和示例）

经过本杰明·安德森博 7月 27, 2023 指导 0 条评论

在机器学习领域，我们的目标是创建一个模型，可以有效地使用一组预测变量来预测响应变量的值。

给定一组p个总预测变量，我们可以构建许多模型。我们可以用来选择最佳模型的一种方法称为最佳子集选择，它尝试从可以使用预测变量集构建的所有可能模型中选择最佳模型。

不幸的是，这种方法有两个缺点：

选择最佳子集的另一种方法称为逐步选择，它会比较较小的模型集。

步选择方法有两种：前向步选择和后向步选择。

逐步前向选择的工作原理如下：

1.设 M ₀为空模型，不包含预测变量。

2.对于 k = 0, 2, … p-1：

3.使用交叉验证预测误差、Cp、BIC、AIC 或调整后的 R ²从 M ₀ … M _p中选择单个最佳模型。

后退步骤选择的工作原理如下：

1.令 M _p为完整模型，其中包含所有p个预测变量。

2.对于 k = p, p-1, … 1：

3.使用交叉验证预测误差、Cp、BIC、AIC 或调整后的 R ²从 M ₀ … M _p中选择单个最佳模型。

逐步向前和向后选择的最后一步是选择具有最低预测误差、最低Cp、最低BIC、最高AIC low 或最高调整R ²的模型。

以下是用于计算每个指标的公式：

Cp： (RSS+2dσ̂) / n

AIC： (RSS+2dσ̂ ² ) / (nσ̂ ² )

BIC: (RSS+log(n)dσ̂ ² ) / n

R ²调整： 1 – ( (RSS / (nd-1)) / (TSS / (n-1)) )

金子：

阶段性选择具有以下优点：

该方法比选择最佳子集的计算效率更高。给定p 个预测变量，最佳子集的选择必须对应于 2 ^p个模型。

相反，逐步选择应该只适合 1+p(p+ 1)/2 模型。对于 p = 10 个预测变量，最佳子集选择应适合 1,000 个模型，而逐步选择应仅适合 56 个模型。

然而，阶段性选择有以下潜在缺点：

不能保证在所有潜在^2p模型中找到最好的模型。

例如，假设我们有一个包含 p = 3 个预测变量的数据集。最佳可能的单预测器模型可能包含 x ₁ ，而最佳可能的双预测器模型可能包含 x ₁和 x ₂ 。

在这种情况下，前向逐步选择将无法选择最佳的双预测模型，因为 M ₁将包含 x ₁ ，因此 M ₂也必须包含 x ₁以及另一个变量。

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多