Como interpretar pr(>|t|) na saída do modelo de regressão em r
Sempre que você realizar uma regressão linear em R, a saída do seu modelo de regressão será exibida no seguinte formato:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
A coluna Pr(>|t|) representa o valor p associado ao valor na coluna do valor t .
Se o valor p estiver abaixo de um certo nível de significância (por exemplo, α = 0,05), então a variável preditora é considerada como tendo uma relação estatisticamente significativa com a variável resposta no modelo.
O exemplo a seguir mostra como interpretar os valores na coluna Pr(>|t|) para um determinado modelo de regressão.
Exemplo: como interpretar valores Pr(>|t|)
Suponha que queiramos ajustar um modelo de regressão linear múltipla usando variáveis preditoras x1 e x2 e uma variável de resposta única y .
O código a seguir mostra como criar um quadro de dados e ajustar um modelo de regressão aos dados:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
Veja como interpretar os valores na coluna Pr(>|t|):
- O valor p para a variável preditora x1 é 0,0325 . Como esse valor é inferior a 0,05, existe uma relação estatisticamente significativa com a variável resposta do modelo.
- O valor p para a variável preditora x2 é 0,3732 . Como esse valor não é inferior a 0,05, não apresenta relação estatisticamente significativa com a variável resposta do modelo.
Os códigos de significância abaixo da tabela de coeficientes nos dizem que um único asterisco (*) próximo ao valor p de 0,0325 significa que o valor p é estatisticamente significativo em α = 0,05.
Como Pr(>|t|) é realmente calculado?
Aqui está como o valor de Pr(>|t|) é realmente calculado:
Etapa 1: calcular o valor t
Primeiro, calculamos o valor t usando a seguinte fórmula:
- valor t = Estimativa / Padrão. Erro
Por exemplo, aqui está como calcular o valor t para a variável preditora x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
Etapa 2: Calcule o valor p
A seguir, calculamos o valor p. Isso representa a probabilidade de que o valor absoluto da distribuição t seja maior que 2,935.
Podemos usar a seguinte fórmula em R para calcular esse valor:
- valor p = 2 * pt (abs (valor t), df residual, cauda inferior = FALSO)
Por exemplo, aqui está como calcular o valor p para um valor t de 2,935 com 5 graus de liberdade residuais:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
Observe que esse valor p corresponde ao valor p na saída da regressão acima.
Nota: O valor dos graus de liberdade residuais está na parte inferior da saída da regressão. Em nosso exemplo, acabou sendo 5:
Residual standard error: 1.867 on 5 degrees of freedom
Recursos adicionais
Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como traçar resultados de regressão linear múltipla em R