So interpretieren sie die regressionsausgabe in r


Um ein lineares Regressionsmodell in R anzupassen, können wir den Befehl lm() verwenden.

Um die Ausgabe des Regressionsmodells anzuzeigen, können wir dann den Befehl summary() verwenden.

In diesem Tutorial wird erläutert, wie die einzelnen Werte der Regressionsausgabe in R interpretiert werden.

Beispiel: Interpretieren der Regressionsausgabe in R

Der folgende Code zeigt, wie ein multiples lineares Regressionsmodell mit dem integrierten mtcars- Datensatz angepasst wird, wobei hp , drat und wt als Prädiktorvariablen und mpg als Antwortvariable verwendet werden:

 #fit regression model using hp, drat, and wt as predictors
model <- lm(mpg ~ hp + drat + wt, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 ** 
drat 1.615049 1.226983 1.316 0.198755    
wt -3.227954 0.796398 -4.053 0.000364 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

So interpretieren Sie jeden Wert in der Ausgabe:

Anruf

 Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Dieser Abschnitt erinnert uns an die Formel, die wir in unserem Regressionsmodell verwendet haben. Wir können sehen, dass wir mpg als Antwortvariable und hp , drat und wt als Prädiktorvariablen verwendet haben. Jede Variable stammte aus dem Datensatz namens mtcars .

Rückstand

 Residuals:
    Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078 

In diesem Abschnitt wird eine Zusammenfassung der Verteilung der Residuen aus dem Regressionsmodell angezeigt. Denken Sie daran, dass ein Residuum die Differenz zwischen dem beobachteten Wert und dem vorhergesagten Wert des Regressionsmodells ist.

Das minimale Residuum betrug -3,3598 , das mittlere Residuum -0,5099 und das maximale Residuum 5,7078 .

Koeffizienten

 Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 ** 
drat 1.615049 1.226983 1.316 0.198755    
wt -3.227954 0.796398 -4.053 0.000364 ***

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

In diesem Abschnitt werden die geschätzten Koeffizienten des Regressionsmodells angezeigt. Wir können diese Koeffizienten verwenden, um die folgende geschätzte Regressionsgleichung zu bilden:

mpg = 29,39 – 0,03*PS + 1,62*Drat – 3,23*Gewicht

Für jede Prädiktorvariable erhalten wir die folgenden Werte:

Schätzung: der geschätzte Koeffizient. Dies zeigt uns den durchschnittlichen Anstieg der Antwortvariablen, der mit einem Anstieg der Prädiktorvariablen um eine Einheit einhergeht, vorausgesetzt, dass alle anderen Prädiktorvariablen konstant bleiben.

Standard. Fehler : Dies ist der Standardfehler des Koeffizienten. Dies ist ein Maß für die Unsicherheit unserer Schätzung des Koeffizienten.

t-Wert: Dies ist die t-Statistik für die Prädiktorvariable, berechnet als (Schätzung) / (Standardfehler).

Pr(>|t|): Dies ist der p-Wert, der der t-Statistik entspricht. Liegt dieser Wert unter einem bestimmten Alpha-Wert (z. B. 0,05), gilt die Vorhersagevariable als statistisch signifikant.

Wenn wir einen Alpha-Wert von α = 0,05 verwenden würden, um zu bestimmen, welche Prädiktoren in diesem Regressionsmodell signifikant waren, würden wir sagen, dass hp und wt statistisch signifikante Prädiktoren sind, drat hingegen nicht.

Bewertung der Modellangemessenheit

 Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

In diesem letzten Abschnitt werden verschiedene Zahlen angezeigt, die uns helfen zu beurteilen, wie gut das Regressionsmodell zu unserem Datensatz passt.

Reststandardfehler: Dieser gibt uns den durchschnittlichen Abstand zwischen den beobachteten Werten und der Regressionsgeraden an. Je kleiner der Wert, desto besser kann das Regressionsmodell die Daten anpassen.

Freiheitsgrade werden als nk-1 berechnet, wobei n = Gesamtzahl der Beobachtungen und k = Zahl der Prädiktoren. In diesem Beispiel hat mtcars 32 Beobachtungen und wir haben 3 Prädiktoren im Regressionsmodell verwendet, sodass die Freiheitsgrade 32 – 3 – 1 = 28 sind.

Multiples R-Quadrat: Dies wird als Bestimmtheitsmaß bezeichnet. Es sagt uns, wie viel der Varianz der Antwortvariablen durch die Prädiktorvariablen erklärt werden kann.

Dieser Wert liegt zwischen 0 und 1. Je näher er bei 1 liegt, desto besser können die Prädiktorvariablen den Wert der Antwortvariablen vorhersagen.

Angepasstes R-Quadrat: Dies ist eine modifizierte Version des R-Quadrats, die basierend auf der Anzahl der Prädiktoren im Modell angepasst wurde. Es ist immer kleiner als R im Quadrat.

Das angepasste R-Quadrat kann nützlich sein, um die Anpassung verschiedener Regressionsmodelle zu vergleichen, die eine unterschiedliche Anzahl von Prädiktorvariablen verwenden.

F-Statistik: Gibt an, ob das Regressionsmodell eine bessere Anpassung an die Daten bietet als ein Modell, das keine unabhängigen Variablen enthält. Im Wesentlichen wird getestet, ob das Regressionsmodell als Ganzes nützlich ist.

p-Wert: Dies ist der p-Wert, der der F-Statistik entspricht. Liegt dieser Wert unter einem bestimmten Signifikanzniveau (z. B. 0,05), passt das Regressionsmodell besser zu den Daten als ein Modell ohne Prädiktoren.

Bei der Erstellung von Regressionsmodellen hoffen wir, dass dieser p-Wert unter einem bestimmten Signifikanzniveau liegt, da er anzeigt, dass die Prädiktorvariablen tatsächlich für die Vorhersage des Werts der Antwortvariablen nützlich sind.

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
Was ist ein guter R-Quadrat-Wert?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert