So interpretieren sie pr(>|z|) in der logistischen regressionsausgabe in r


Immer wenn Sie eine logistische Regression in R durchführen, wird die Ausgabe Ihres Regressionsmodells im folgenden Format angezeigt:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Die Spalte „Pr(>|z|)“ stellt den p-Wert dar, der dem Wert in der Spalte „z-Wert“ zugeordnet ist.

Wenn der p-Wert unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), weist dies darauf hin, dass die Prädiktorvariable eine statistisch signifikante Beziehung zur Antwortvariablen im Modell hat.

Das folgende Beispiel zeigt, wie die Werte der Spalte Pr(>|z|) für ein logistisches Regressionsmodell in der Praxis interpretiert werden.

Beispiel: So interpretieren Sie Pr(>|z|)-Werte

Der folgende Code zeigt, wie man mithilfe des integrierten mtcars- Datensatzes ein logistisches Regressionsmodell in R anpasst:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

So interpretieren Sie die Werte in der Spalte Pr(>|z|):

  • Der p-Wert für die Prädiktorvariable „disp“ beträgt 0,5305 . Da dieser Wert nicht kleiner als 0,05 ist, besteht kein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.
  • Der p-Wert für die Prädiktorvariable „drat“ beträgt 0,0315 . Da dieser Wert kleiner als 0,05 ist, besteht ein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.

Die Signifikanzcodes unter der Koeffiziententabelle sagen uns, dass ein einzelnes Sternchen (*) neben dem p-Wert von 0,0315 bedeutet, dass der p-Wert bei α = 0,05 statistisch signifikant ist.

Wie wird Pr(>|z|) berechnet?

So wird der Wert von Pr(>|z|) tatsächlich berechnet:

Schritt 1: Berechnen Sie den Z-Wert

Zuerst berechnen wir den Z-Wert mit der folgenden Formel:

  • z-Wert = Schätzung / Std. Fehler

So berechnen Sie beispielsweise den Z-Wert für die Prädiktorvariable „drat“:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Schritt 2: Berechnen Sie den p-Wert

Als nächstes berechnen wir den zweiseitigen p-Wert. Dies stellt die Wahrscheinlichkeit dar, dass der Absolutwert der Normalverteilung größer als 2,151 oder kleiner als -2,151 ist.

Wir können die folgende Formel in R verwenden, um diesen Wert zu berechnen:

  • p-Wert = 2 * (1-pnorm(z-Wert))

So berechnen Sie beispielsweise den zweiseitigen p-Wert für einen z-Wert von 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Beachten Sie, dass dieser p-Wert mit dem p-Wert in der obigen Regressionsausgabe übereinstimmt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie verschiedene Regressionsmodelle in R angepasst werden:

So führen Sie eine logistische Regression in R durch
So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert