如何找到 r 中的决定系数(r 平方)


决定系数(通常表示为 R 2 )是可以由回归模型中的解释变量解释的响应变量方差的比例。

本教程提供了如何在 R 回归模型中查找和解释R2的示例。

相关: 什么是好的 R 平方值?

示例:在 R 中查找并解释 R 平方

假设我们有以下数据集,其中包含 15 名学生的学习时数、参加的预备考试以及收到的考试成绩的数据:

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

以下代码展示了如何将 多元线性回归模型拟合到该数据集并在 R 中显示模型输出:

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

模型的 R 平方(显示在输出的最底部)结果为0.7237

这意味着72.37%的考试成绩差异可以通过学习时数和练习考试次数来解释。

请注意,您还可以使用以下语法访问该值:

 summary(model)$r.squared

[1] 0.7236545

如何解释 R 平方值

R 平方值始终介于 0 和 1 之间。

值为 1 表示解释变量可以完美解释响应变量的方差,值为 0 表示解释变量不具备解释响应变量方差的能力。

一般来说,回归模型的 R 平方值越大,解释变量越能预测响应变量的值。

请查看这篇文章,了解有关如何确定给定 R 平方值对于给定回归模型是否被视为“良好”的更多详细信息。

相关:如何计算 R 中调整后的 R 平方

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注