Come interpretare pr(>|z|) nell'output della regressione logistica in r


Ogni volta che esegui una regressione logistica in R, l’output del tuo modello di regressione verrà visualizzato nel seguente formato:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

La colonna Pr(>|z|) rappresenta il valore p associato al valore nella colonna del valore z .

Se il valore p è inferiore a un certo livello di significatività (ad esempio α = 0,05), ciò indica che la variabile predittore ha una relazione statisticamente significativa con la variabile di risposta nel modello.

L’esempio seguente mostra come interpretare nella pratica i valori della colonna Pr(>|z|) per un modello di regressione logistica.

Esempio: come interpretare i valori Pr(>|z|).

Il codice seguente mostra come adattare un modello di regressione logistica in R utilizzando il set di dati mtcars integrato:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Ecco come interpretare i valori nella colonna Pr(>|z|):

  • Il valore p per la variabile predittrice “disp” è 0,5305 . Poiché questo valore non è inferiore a 0,05, non ha una relazione statisticamente significativa con la variabile di risposta nel modello.
  • Il valore p per la variabile predittrice “drat” è 0,0315 . Poiché questo valore è inferiore a 0,05, esiste una relazione statisticamente significativa con la variabile di risposta nel modello.

I codici di significatività sotto la tabella dei coefficienti ci dicono che un singolo asterisco (*) accanto al valore p di 0,0315 significa che il valore p è statisticamente significativo a α = 0,05.

Come viene calcolato Pr(>|z|)?

Ecco come viene effettivamente calcolato il valore di Pr(>|z|):

Passaggio 1: calcolare il valore z

Innanzitutto, calcoliamo il valore z utilizzando la seguente formula:

  • Valore z = Stima / Std. Errore

Ad esempio, ecco come calcolare il valore z per la variabile predittrice “drat”:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Passaggio 2: calcolare il valore p

Successivamente, calcoliamo il valore p a due code. Ciò rappresenta la probabilità che il valore assoluto della distribuzione normale sia maggiore di 2,151 o minore di -2,151.

Possiamo usare la seguente formula in R per calcolare questo valore:

  • valore p = 2 * (1-pnorm(valore z))

Ad esempio, ecco come calcolare il valore p a due code per un valore z di 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Si noti che questo valore p corrisponde al valore p nell’output della regressione sopra.

Risorse addizionali

I seguenti tutorial spiegano come adattare diversi modelli di regressione in R:

Come eseguire la regressione logistica in R
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *