Hoe de determinatiecoëfficiënt (r-kwadraat) in r te vinden


De determinatiecoëfficiënt (gewoonlijk R 2 genoemd) is het deel van de variantie van de responsvariabele dat kan worden verklaard door de verklarende variabelen in een regressiemodel.

Deze tutorial geeft een voorbeeld van hoe je R2 kunt vinden en interpreteren in een regressiemodel in R.

Gerelateerd: Wat is een goede R-kwadraatwaarde?

Voorbeeld: het vinden en interpreteren van R-kwadraat in R

Stel dat we de volgende dataset hebben met gegevens over het aantal gestudeerde uren, afgelegde voorbereidende examens en ontvangen examenscores voor 15 studenten:

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

De volgende code laat zien hoe u een meervoudig lineair regressiemodel aan deze gegevensset kunt aanpassen en de modeluitvoer in R kunt weergeven:

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

Het R-kwadraat van het model (helemaal onderaan de uitvoer weergegeven) blijkt 0,7237 te zijn.

Dit betekent dat 72,37% van de variatie in examenscores kan worden verklaard door het aantal gestudeerde uren en het aantal afgelegde oefenexamens.

Houd er rekening mee dat u deze waarde ook kunt openen met behulp van de volgende syntaxis:

 summary(model)$r.squared

[1] 0.7236545

Hoe de R-kwadraatwaarde te interpreteren

Een R-kwadraatwaarde ligt altijd tussen 0 en 1.

Een waarde van 1 geeft aan dat de verklarende variabelen de variantie van de responsvariabele perfect kunnen verklaren en een waarde van 0 geeft aan dat de verklarende variabelen niet in staat zijn de variantie van de responsvariabele te verklaren.

Over het algemeen geldt dat hoe groter de R-kwadraatwaarde van een regressiemodel is, hoe beter de verklarende variabelen in staat zijn de waarde van de responsvariabele te voorspellen.

Bekijk dit artikel voor meer informatie over hoe u kunt bepalen of een bepaalde R-kwadraatwaarde al dan niet als ‚goed‘ wordt beschouwd voor een bepaald regressiemodel.

Gerelateerd: Hoe u het aangepaste R-kwadraat in R kunt berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert