So interpretieren sie pr(>|t|) in der regressionsmodellausgabe in r
Immer wenn Sie eine lineare Regression in R durchführen, wird die Ausgabe Ihres Regressionsmodells im folgenden Format angezeigt:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
Die Spalte Pr(>|t|) stellt den p-Wert dar, der dem Wert in der t- Wertspalte zugeordnet ist.
Wenn der p-Wert unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), wird davon ausgegangen, dass die Prädiktorvariable eine statistisch signifikante Beziehung zur Antwortvariablen im Modell hat.
Das folgende Beispiel zeigt, wie die Werte in der Spalte Pr(>|t|) für ein bestimmtes Regressionsmodell interpretiert werden.
Beispiel: So interpretieren Sie Pr(>|t|)-Werte
Angenommen, wir möchten ein multiples lineares Regressionsmodell mithilfe der Prädiktorvariablen x1 und x2 und einer einzelnen Antwortvariablen y anpassen.
Der folgende Code zeigt, wie man einen Datenrahmen erstellt und ein Regressionsmodell an die Daten anpasst:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
So interpretieren Sie die Werte in der Spalte Pr(>|t|):
- Der p-Wert für die Prädiktorvariable x1 beträgt 0,0325 . Da dieser Wert kleiner als 0,05 ist, besteht ein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.
- Der p-Wert für die Prädiktorvariable x2 beträgt 0,3732 . Da dieser Wert nicht kleiner als 0,05 ist, besteht kein statistisch signifikanter Zusammenhang mit der Antwortvariablen im Modell.
Die Signifikanzcodes unter der Koeffiziententabelle sagen uns, dass ein einzelnes Sternchen (*) neben dem p-Wert von 0,0325 bedeutet, dass der p-Wert bei α = 0,05 statistisch signifikant ist.
Wie wird Pr(>|t|) eigentlich berechnet?
So wird der Wert von Pr(>|t|) tatsächlich berechnet:
Schritt 1: Berechnen Sie den t-Wert
Zunächst berechnen wir den t-Wert nach folgender Formel:
- t-Wert = Schätzung / Std. Fehler
So berechnen Sie beispielsweise den t-Wert für die Prädiktorvariable x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
Schritt 2: Berechnen Sie den p-Wert
Als nächstes berechnen wir den p-Wert. Dies stellt die Wahrscheinlichkeit dar, dass der Absolutwert der t-Verteilung größer als 2,935 ist.
Wir können die folgende Formel in R verwenden, um diesen Wert zu berechnen:
- p-Wert = 2 * pt (abs (t-Wert), Rest-df, unterer Schwanz = FALSCH)
So berechnen Sie beispielsweise den p-Wert für einen t-Wert von 2,935 mit 5 Restfreiheitsgraden:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
Beachten Sie, dass dieser p-Wert mit dem p-Wert in der obigen Regressionsausgabe übereinstimmt.
Hinweis: Der Wert der verbleibenden Freiheitsgrade steht am Ende der Regressionsausgabe. In unserem Beispiel waren es 5:
Residual standard error: 1.867 on 5 degrees of freedom
Zusätzliche Ressourcen
So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
So zeichnen Sie mehrere lineare Regressionsergebnisse in R auf