Como interpretar pr(>|t|) na saída do modelo de regressão em r


Sempre que você realizar uma regressão linear em R, a saída do seu modelo de regressão será exibida no seguinte formato:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

A coluna Pr(>|t|) representa o valor p associado ao valor na coluna do valor t .

Se o valor p estiver abaixo de um certo nível de significância (por exemplo, α = 0,05), então a variável preditora é considerada como tendo uma relação estatisticamente significativa com a variável resposta no modelo.

O exemplo a seguir mostra como interpretar os valores na coluna Pr(>|t|) para um determinado modelo de regressão.

Exemplo: como interpretar valores Pr(>|t|)

Suponha que queiramos ajustar um modelo de regressão linear múltipla usando variáveis preditoras x1 e x2 e uma variável de resposta única y .

O código a seguir mostra como criar um quadro de dados e ajustar um modelo de regressão aos dados:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Veja como interpretar os valores na coluna Pr(>|t|):

  • O valor p para a variável preditora x1 é 0,0325 . Como esse valor é inferior a 0,05, existe uma relação estatisticamente significativa com a variável resposta do modelo.
  • O valor p para a variável preditora x2 é 0,3732 . Como esse valor não é inferior a 0,05, não apresenta relação estatisticamente significativa com a variável resposta do modelo.

Os códigos de significância abaixo da tabela de coeficientes nos dizem que um único asterisco (*) próximo ao valor p de 0,0325 significa que o valor p é estatisticamente significativo em α = 0,05.

Como Pr(>|t|) é realmente calculado?

Aqui está como o valor de Pr(>|t|) é realmente calculado:

Etapa 1: calcular o valor t

Primeiro, calculamos o valor t usando a seguinte fórmula:

  • valor t = Estimativa / Padrão. Erro

Por exemplo, aqui está como calcular o valor t para a variável preditora x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Etapa 2: Calcule o valor p

A seguir, calculamos o valor p. Isso representa a probabilidade de que o valor absoluto da distribuição t seja maior que 2,935.

Podemos usar a seguinte fórmula em R para calcular esse valor:

  • valor p = 2 * pt (abs (valor t), df residual, cauda inferior = FALSO)

Por exemplo, aqui está como calcular o valor p para um valor t de 2,935 com 5 graus de liberdade residuais:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Observe que esse valor p corresponde ao valor p na saída da regressão acima.

Nota: O valor dos graus de liberdade residuais está na parte inferior da saída da regressão. Em nosso exemplo, acabou sendo 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Recursos adicionais

Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como traçar resultados de regressão linear múltipla em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *