So finden sie das bestimmtheitsmaß (r-quadrat) in r


Das Bestimmtheitsmaß (allgemein als R 2 bezeichnet) ist der Anteil der Varianz der Antwortvariablen , der durch die erklärenden Variablen in einem Regressionsmodell erklärt werden kann.

Dieses Tutorial bietet ein Beispiel dafür, wie man R2 in einem Regressionsmodell in R findet und interpretiert.

Verwandt:Was ist ein guter R-Quadrat-Wert?

Beispiel: Finden und Interpretieren des R-Quadrats in R

Angenommen, wir verfügen über den folgenden Datensatz mit Daten zur Anzahl der gelernten Stunden, den abgelegten Vorbereitungsprüfungen und den erhaltenen Prüfungsergebnissen für 15 Studenten:

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell an diesen Datensatz anpasst und die Modellausgabe in R anzeigt:

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

Das R-Quadrat des Modells (ganz unten in der Ausgabe angezeigt) beträgt 0,7237 .

Dies bedeutet, dass 72,37 % der Abweichungen in den Prüfungsergebnissen durch die Anzahl der Lernstunden und die Anzahl der abgelegten Übungsprüfungen erklärt werden können.

Beachten Sie, dass Sie auf diesen Wert auch mit der folgenden Syntax zugreifen können:

 summary(model)$r.squared

[1] 0.7236545

So interpretieren Sie den R-Quadrat-Wert

Ein R-Quadrat-Wert liegt immer zwischen 0 und 1.

Ein Wert von 1 gibt an, dass die erklärenden Variablen die Varianz der Antwortvariablen perfekt erklären können, und ein Wert von 0 zeigt an, dass die erklärenden Variablen nicht in der Lage sind, die Varianz der Antwortvariablen zu erklären.

Im Allgemeinen gilt: Je größer der R-Quadrat-Wert eines Regressionsmodells, desto besser können die erklärenden Variablen den Wert der Antwortvariablen vorhersagen.

Weitere Informationen dazu, wie Sie feststellen können, ob ein bestimmter R-Quadrat-Wert für ein bestimmtes Regressionsmodell als „gut“ gilt oder nicht, finden Sie indiesem Artikel .

Verwandt: So berechnen Sie das angepasste R-Quadrat in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert