So interpretieren sie pr(>|t|) in der regressionsmodellausgabe in r


Immer wenn Sie eine lineare Regression in R durchführen, wird die Ausgabe Ihres Regressionsmodells im folgenden Format angezeigt:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Die Spalte Pr(>|t|) stellt den p-Wert dar, der dem Wert in der t- Wertspalte zugeordnet ist.

Wenn der p-Wert unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), wird davon ausgegangen, dass die Prädiktorvariable eine statistisch signifikante Beziehung zur Antwortvariablen im Modell hat.

Das folgende Beispiel zeigt, wie die Werte in der Spalte Pr(>|t|) für ein bestimmtes Regressionsmodell interpretiert werden.

Beispiel: So interpretieren Sie Pr(>|t|)-Werte

Angenommen, wir möchten ein multiples lineares Regressionsmodell mithilfe der Prädiktorvariablen x1 und x2 und einer einzelnen Antwortvariablen y anpassen.

Der folgende Code zeigt, wie man einen Datenrahmen erstellt und ein Regressionsmodell an die Daten anpasst:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

So interpretieren Sie die Werte in der Spalte Pr(>|t|):

  • Der p-Wert für die Prädiktorvariable x1 beträgt 0,0325 . Da dieser Wert kleiner als 0,05 ist, besteht ein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.
  • Der p-Wert für die Prädiktorvariable x2 beträgt 0,3732 . Da dieser Wert nicht kleiner als 0,05 ist, besteht kein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.

Die Signifikanzcodes unter der Koeffiziententabelle sagen uns, dass ein einzelnes Sternchen (*) neben dem p-Wert von 0,0325 bedeutet, dass der p-Wert bei α = 0,05 statistisch signifikant ist.

Wie wird Pr(>|t|) eigentlich berechnet?

So wird der Wert von Pr(>|t|) tatsächlich berechnet:

Schritt 1: Berechnen Sie den t-Wert

Zunächst berechnen wir den t-Wert nach folgender Formel:

  • t-Wert = Schätzung / Std. Fehler

So berechnen Sie beispielsweise den t-Wert für die Prädiktorvariable x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Schritt 2: Berechnen Sie den p-Wert

Als nächstes berechnen wir den p-Wert. Dies stellt die Wahrscheinlichkeit dar, dass der Absolutwert der t-Verteilung größer als 2,935 ist.

Wir können die folgende Formel in R verwenden, um diesen Wert zu berechnen:

  • p-Wert = 2 * pt (abs (t-Wert), Rest-df, unterer Schwanz = FALSCH)

So berechnen Sie beispielsweise den p-Wert für einen t-Wert von 2,935 mit 5 Restfreiheitsgraden:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Beachten Sie, dass dieser p-Wert mit dem p-Wert in der obigen Regressionsausgabe übereinstimmt.

Hinweis: Der Wert der verbleibenden Freiheitsgrade steht am Ende der Regressionsausgabe. In unserem Beispiel waren es 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
So zeichnen Sie mehrere lineare Regressionsergebnisse in R auf

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert