如何计算r中的紫色'cp
在回归分析中, Mallows Cp是用于在多个潜在模型中选择最佳回归模型的度量。
我们可以通过识别具有接近p +1 的最低 Cp 值的模型来识别“最佳”回归模型,其中p是模型中预测变量的数量。
在 R 中计算 Mallows Cp 的最简单方法是使用olsrr包中的ols_mallows_cp()函数。
以下示例演示如何使用此函数计算 Mallows’ Cp,以在 R 中的多个潜在模型中选择最佳回归模型。
示例:R 中 Mallows Cp 的计算
假设我们想要使用mtcars数据集中的变量来拟合三个不同的多元线性回归模型。
以下代码显示了如何拟合以下回归模型:
- 完整模型中的预测变量:10 个变量
- 模型 1 中的预测变量:disp、hp、wt、qsec
- 模型 2 中的预测变量:disp、qsec
- 模型 3 中的预测变量:disp、wt
以下代码显示如何拟合每个回归模型并使用ols_mallows_cp()函数计算每个模型的 Mallows Cp:
library (olsrr) #fit full model full_model <- lm(mpg ~ ., data = mtcars) #fit three smaller models model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars) model2 <- lm(mpg ~ disp + qsec, data = mtcars) model3 <- lm(mpg ~ disp + wt, data = mtcars) #calculate Mallows' Cp for each model ols_mallows_cp(model1, full_model) [1] 4.430434 ols_mallows_cp(model2, full_model) [1] 18.64082 ols_mallows_cp(model3, full_model) [1] 9.122225
以下是如何解释结果:
- 模型 1: p + 1 = 5,锦葵 Cp = 4.43
- 模型 2: p + 1 = 3,锦葵 Cp = 18.64
- 模型 3: p + 1 = 30,锦葵 Cp = 9.12
我们可以看到模型 1 的 Mallows Cp 值最接近p + 1,表明它是三个潜在模型中导致偏差最小的最佳模型。
关于 Cp des mauves 的注释
关于 Mallows Cp 需要注意以下几点:
- 如果每个潜在模型具有较高的 Mallows Cp 值,则表明每个模型中可能缺少一些重要的预测变量。
- 如果多个潜在模型的 Mallow’s Cp 值较低,请选择值最低的模型作为要使用的最佳模型。
请记住,Mallows 的 Cp 只是在多个潜在模型中识别“最佳”回归模型的一种方法。
另一个常用的度量是调整后的 R 平方,它告诉我们响应变量中可以由模型中的预测变量解释的方差比例,并根据所使用的预测变量的数量进行调整。
要在多个不同模型的列表中确定哪种回归模型最好,建议同时查看 Mallows 的 Cp 和调整后的 R 平方。