Como interpretar pr(>|z|) na saída de regressão logística em r


Sempre que você realizar uma regressão logística em R, a saída do seu modelo de regressão será exibida no seguinte formato:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

A coluna Pr(>|z|) representa o valor p associado ao valor na coluna do valor z .

Se o valor p estiver abaixo de um certo nível de significância (por exemplo, α = 0,05), isso indica que a variável preditora tem uma relação estatisticamente significativa com a variável resposta no modelo.

O exemplo a seguir mostra como interpretar os valores da coluna Pr(>|z|) para um modelo de regressão logística na prática.

Exemplo: Como interpretar valores Pr(>|z|)

O código a seguir mostra como ajustar um modelo de regressão logística em R usando o conjunto de dados integrado mtcars :

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Veja como interpretar os valores na coluna Pr(>|z|):

  • O valor p para a variável preditora “disp” é 0,5305 . Como esse valor não é inferior a 0,05, não apresenta relação estatisticamente significativa com a variável resposta do modelo.
  • O valor p para a variável preditora “drat” é 0,0315 . Como esse valor é inferior a 0,05, existe uma relação estatisticamente significativa com a variável resposta do modelo.

Os códigos de significância abaixo da tabela de coeficientes nos dizem que um único asterisco (*) próximo ao valor p de 0,0315 significa que o valor p é estatisticamente significativo em α = 0,05.

Como Pr(>|z|) é calculado?

Aqui está como o valor de Pr(>|z|) é realmente calculado:

Etapa 1: calcular o valor z

Primeiro, calculamos o valor z usando a seguinte fórmula:

  • valor z = Estimativa / Padrão. Erro

Por exemplo, aqui está como calcular o valor z para a variável preditora “drat”:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Etapa 2: Calcule o valor p

A seguir, calculamos o valor p bicaudal. Isso representa a probabilidade de que o valor absoluto da distribuição normal seja maior que 2,151 ou menor que -2,151.

Podemos usar a seguinte fórmula em R para calcular esse valor:

  • valor p = 2 * (1-pnorma(valor z))

Por exemplo, veja como calcular o valor p bicaudal para um valor z de 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Observe que esse valor p corresponde ao valor p na saída da regressão acima.

Recursos adicionais

Os tutoriais a seguir explicam como ajustar diferentes modelos de regressão em R:

Como realizar regressão logística em R
Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *