如何计算r中的紫色'cp


在回归分析中, Mallows Cp是用于在多个潜在模型中选择最佳回归模型的度量。

我们可以通过识别具有接近p +1 的最低 Cp 值的模型来识别“最佳”回归模型,其中p是模型中预测变量的数量。

在 R 中计算 Mallows Cp 的最简单方法是使用olsrr包中的ols_mallows_cp()函数。

以下示例演示如何使用此函数计算 Mallows’ Cp,以在 R 中的多个潜在模型中选择最佳回归模型。

示例:R 中 Mallows Cp 的计算

假设我们想要使用mtcars数据集中的变量来拟合三个不同的多元线性回归模型。

以下代码显示了如何拟合以下回归模型:

  • 完整模型中的预测变量:10 个变量
  • 模型 1 中的预测变量:disp、hp、wt、qsec
  • 模型 2 中的预测变量:disp、qsec
  • 模型 3 中的预测变量:disp、wt

以下代码显示如何拟合每个回归模型并使用ols_mallows_cp()函数计算每个模型的 Mallows Cp:

 library (olsrr)

#fit full model
full_model <- lm(mpg ~ ., data = mtcars)

#fit three smaller models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

#calculate Mallows' Cp for each model
ols_mallows_cp(model1, full_model)

[1] 4.430434

ols_mallows_cp(model2, full_model)

[1] 18.64082

ols_mallows_cp(model3, full_model)

[1] 9.122225

以下是如何解释结果:

  • 模型 1: p + 1 = 5,锦葵 Cp = 4.43
  • 模型 2: p + 1 = 3,锦葵 Cp = 18.64
  • 模型 3: p + 1 = 30,锦葵 Cp = 9.12

我们可以看到模型 1 的 Mallows Cp 值最接近p + 1,表明它是三个潜在模型中导致偏差最小的最佳模型。

关于 Cp des mauves 的注释

关于 Mallows Cp 需要注意以下几点:

  • 如果每个潜在模型具有较高的 Mallows Cp 值,则表明每个模型中可能缺少一些重要的预测变量。
  • 如果多个潜在模型的 Mallow’s Cp 值较低,请选择值最低的模型作为要使用的最佳模型。

请记住,Mallows 的 Cp 只是在多个潜在模型中识别“最佳”回归模型的一种方法。

另一个常用的度量是调整后的 R 平方,它告诉我们响应变量中可以由模型中的预测变量解释的方差比例,并根据所使用的预测变量的数量进行调整。

要在多个不同模型的列表中确定哪种回归模型最好,建议同时查看 Mallows 的 Cp 和调整后的 R 平方。

其他资源

如何计算 R 中调整后的 R 平方
如何在R中计算AIC

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注