Hoe pr(>|z|) te interpreteren in logistieke regressie-uitvoer in r


Telkens wanneer u een logistieke regressie in R uitvoert, wordt de uitvoer van uw regressiemodel in het volgende formaat weergegeven:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

De kolom Pr(>|z|) vertegenwoordigt de p-waarde die is gekoppeld aan de waarde in de z- waardekolom.

Als de p-waarde onder een bepaald significantieniveau ligt (bijvoorbeeld α = 0,05), geeft dit aan dat de voorspellende variabele een statistisch significante relatie heeft met deresponsvariabele in het model.

Het volgende voorbeeld laat zien hoe u de waarden van de Pr(>|z|)-kolom voor een logistisch regressiemodel in de praktijk kunt interpreteren.

Voorbeeld: hoe Pr(>|z|)-waarden moeten worden geïnterpreteerd

De volgende code laat zien hoe u een logistisch regressiemodel in R kunt passen met behulp van de ingebouwde mtcars- gegevensset:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Zo interpreteert u de waarden in de kolom Pr(>|z|):

  • De p-waarde voor de voorspellende variabele “disp” is 0,5305 . Omdat deze waarde niet kleiner is dan 0,05, heeft deze geen statistisch significante relatie met de responsvariabele in het model.
  • De p-waarde voor de voorspellende variabele “drat” is 0,0315 . Omdat deze waarde kleiner is dan 0,05, is er een statistisch significante relatie met de responsvariabele in het model.

De significantiecodes onder de coëfficiëntentabel vertellen ons dat een enkel sterretje (*) naast de p-waarde van 0,0315 betekent dat de p-waarde statistisch significant is bij α = 0,05.

Hoe wordt Pr(>|z|) berekend?

Hier ziet u hoe de waarde van Pr(>|z|) feitelijk wordt berekend:

Stap 1: Bereken de z-waarde

Eerst berekenen we de z-waarde met behulp van de volgende formule:

  • z-waarde = Schatting / Std. Fout

Hier ziet u bijvoorbeeld hoe u de z-waarde voor de voorspellende variabele “drat” berekent:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Stap 2: Bereken de p-waarde

Vervolgens berekenen we de tweezijdige p-waarde. Dit vertegenwoordigt de waarschijnlijkheid dat de absolute waarde van de normale verdeling groter is dan 2,151 of kleiner dan -2,151.

We kunnen de volgende formule in R gebruiken om deze waarde te berekenen:

  • p-waarde = 2 * (1-pnorm(z-waarde))

Zo berekent u bijvoorbeeld de tweezijdige p-waarde voor een z-waarde van 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Merk op dat deze p-waarde overeenkomt met de p-waarde in de bovenstaande regressie-uitvoer.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u verschillende regressiemodellen in R kunt passen:

Hoe logistische regressie uit te voeren in R
Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert