Hoe r-kwadraat te berekenen in google spreadsheets
R-kwadraat , vaak geschreven als r2 , is een maatstaf voor hoe goed een lineair regressiemodel bij een reeks gegevens past.
In technische termen is het het deel van de variantie in de responsvariabele dat kan worden verklaard door de voorspellende variabele.
De waarde van r 2 kan variëren van 0 tot 1:
- Een waarde van 0 geeft aan dat de responsvariabele helemaal niet kan worden verklaard door de voorspellende variabele.
- Een waarde van 1 geeft aan dat de responsvariabele perfect en zonder fouten kan worden verklaard door de voorspellende variabele.
In het volgende voorbeeld ziet u hoe u R kwadraat berekent voor twee variabelen in Google Spreadsheets.
Voorbeeld: R-kwadraat berekenen in Google Spreadsheets
Stel dat we van 20 studenten de volgende gegevens hebben over het aantal gestudeerde uren en de behaalde examenscore:
Stel nu dat we een eenvoudig lineair regressiemodel willen toepassen, waarbij we ‚uren‘ als voorspellende variabele en ’score‘ als responsvariabele gebruiken.
Om het R-kwadraat van dit model te vinden, kunnen we de Google Spreadsheets RSQ()- functie gebruiken, die de volgende syntaxis gebruikt:
=RSQ(bekende_ys, bekende_xs)
Goud:
- bekende_ys: de waarden van de responsvariabele
- bekende_xs: waarden van de voorspellende variabele
In ons voorbeeld kunnen we de volgende formule in cel D2 typen:
=RSQ( A2:A21 , B2:B21 )
De volgende schermafbeelding laat zien hoe u deze formule in de praktijk kunt gebruiken:
De R-kwadraatwaarde blijkt ongeveer 0,7273 te zijn.
Dit betekent dat 72,73% van de variatie in examenscores kan worden verklaard door het aantal gestudeerde uren.
Gerelateerd: Wat is een goede R-kwadraatwaarde?
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Google Spreadsheets kunt uitvoeren:
Hoe u een best passende rij kunt vinden in Google Spreadsheets
Lineaire regressie uitvoeren in Google Spreadsheets
Een prognose maken in Google Spreadsheets (met voorbeeld)