如何解释 r 中回归模型输出中的 pr(>|t|)
每当您在 R 中执行线性回归时,回归模型的输出将以以下格式显示:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
Pr(>|t|)列表示与t 值列中的值关联的 p 值。
如果 p 值低于一定的显着性水平(例如 α = 0.05),则认为预测变量与模型中的响应变量具有统计显着关系。
以下示例显示如何解释给定回归模型的 Pr(>|t|) 列中的值。
示例:如何解释 Pr(>|t|) 值
假设我们想要使用预测变量x1和x2以及单个响应变量y拟合多元线性回归模型。
以下代码显示了如何创建数据框并将回归模型拟合到数据:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
以下是如何解释 Pr(>|t|) 列中的值:
- 预测变量 x1 的 p 值为0.0325 。由于该值小于 0.05,因此与模型中的响应变量存在统计显着关系。
- 预测变量 x2 的 p 值为0.3732 。由于该值不小于0.05,因此与模型中的响应变量不具有统计显着关系。
系数表下方的显着性代码告诉我们,p 值 0.0325 旁边的单个星号 (*) 表示 p 值在 α = 0.05 时具有统计显着性。
Pr(>|t|) 实际上是如何计算的?
以下是 Pr(>|t|) 值的实际计算方式:
步骤 1:计算 t 值
首先,我们使用以下公式计算t 值:
- t 值= 估计值 / 标准值错误
例如,以下是计算预测变量 x1 的 t 值的方法:
#calculate t-value
1.4758 / .5029
[1] 2.934579
步骤 2:计算 p 值
接下来,我们计算 p 值。这表示 t 分布的绝对值大于 2.935 的概率。
我们可以在R中使用以下公式来计算该值:
- p 值= 2 * pt(abs(t 值),残差 df,lower.tail = FALSE)
例如,以下是如何计算具有 5 个剩余自由度的 t 值 2.935 的 p 值:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
请注意,此 p 值与上面回归输出中的 p 值匹配。
注意:残差自由度的值位于回归输出的底部。在我们的示例中,结果是 5:
Residual standard error: 1.867 on 5 degrees of freedom