Hoe de correlatiecoëfficiënt van r2 te vinden
U kunt decorrelatiecoëfficiënt tussen twee variabelen vinden door de vierkantswortel te nemen van de R-kwadraatwaarde (R 2 ) van een eenvoudig lineair regressiemodel.
Correlatiecoëfficiënt = √ R 2 van eenvoudig lineair regressiemodel
Het teken van de hellingscoëfficiënt in het regressiemodel vertelt u of de correlatiecoëfficiënt positief of negatief is.
De volgende voorbeelden laten zien hoe u in de praktijk de correlatiecoëfficiënt kunt vinden uit de R-kwadraatwaarde van een regressiemodel.
Opmerking : de R-kwadraatwaarde van een regressiemodel wordt ook wel de determinatiecoëfficiënt genoemd.
Voorbeeld 1: Het vinden van de correlatiecoëfficiënt van R 2 (wanneer de helling positief is)
Stel dat we een eenvoudig lineair regressiemodel toepassen met bestudeerde uren als voorspellende variabele en examenscores als responsvariabele.
Stel dat we de volgende uitvoer van het model ontvangen:
Aangepaste regressievergelijking : examenscore = 65,55 + 2,78 (uren gestudeerd)
R-kwadraat (R 2 ) van het regressiemodel : 0,7845
De R-kwadraatwaarde van het model vertelt ons welk percentage van de variatie in examenscores kan worden verklaard door de bestudeerde uren.
In dit voorbeeld kunnen we zien dat de bestudeerde uren 78,45% van de variatie in examenscores kunnen verklaren.
Om de correlatiecoëfficiënt tussen gestudeerde uren en examenresultaten te vinden, kunnen we de vierkantswortel van R 2 nemen:
Correlatiecoëfficiënt = √ R 2 = √ 0,7845 = 0,8857
Omdat het teken positief is voor de bestudeerde uren in de regressievergelijking, is deze correlatiecoëfficiënt positief.
De correlatiecoëfficiënt tussen het aantal gestudeerde uren en de examenscore bedraagt dus 0,8857 .
Voorbeeld 2: Het vinden van de correlatiecoëfficiënt van R 2 (wanneer de helling negatief is)
Stel dat we een eenvoudig lineair regressiemodel passen met leeftijd (in jaren) als voorspellende variabele en maximale bankdrukken (in ponden) als responsvariabele.
Stel dat we de volgende uitvoer van het model ontvangen:
Aangepaste regressievergelijking : maximaal bankdrukken = 240,11 – 1,24 (leeftijd)
R kwadraat (R 2 ) van het regressiemodel : 0,4773
De R-kwadraatwaarde van het model vertelt ons welk percentage van de variatie in piekbankdrukken kan worden verklaard door leeftijd.
In dit voorbeeld kunnen we zien dat leeftijd 47,73% van de variatie in de maximale hoeveelheid bankdrukken kan verklaren.
Om de correlatiecoëfficiënt tussen leeftijd en maximale bankdrukken te vinden, kunnen we de wortel van R 2 nemen:
Correlatiecoëfficiënt = √ R 2 = √ 0,4773 = 0,6909
Omdat het teken van leeftijd negatief is in de regressievergelijking, is deze correlatiecoëfficiënt negatief.
De correlatiecoëfficiënt tussen leeftijd en maximale bankdrukken is dus -0,6909 .
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over correlatiecoëfficiënten:
Wat wordt beschouwd als een “sterke” correlatie?
Wanneer moet je correlatie gebruiken?
Hoe u een correlatie-t-test uitvoert