Hoe u een correlatiematrix maakt in google spreadsheets
Eén manier om de relatie tussen twee variabelen te kwantificeren is door de Pearson-correlatiecoëfficiënt te gebruiken , een maatstaf voor de lineaire associatie tussen twee variabelen . Het heeft een waarde tussen -1 en 1 waarbij:
- -1 geeft een perfect negatieve lineaire correlatie aan tussen twee variabelen
- 0 geeft aan dat er geen lineaire correlatie is tussen twee variabelen
- 1 geeft een perfect positieve lineaire correlatie aan tussen twee variabelen
Hoe verder de correlatiecoëfficiënt van nul verwijderd is, hoe sterker de relatie tussen de twee variabelen.
Maar in sommige gevallen willen we de correlatie tussen meerdere paren variabelen begrijpen. In deze gevallen kunnen we een correlatiematrix maken, een vierkante tabel die de correlatiecoëfficiënten tussen verschillende paarsgewijze combinaties van variabelen weergeeft.
In deze tutorial wordt uitgelegd hoe u een correlatiematrix in Google Spreadsheets maakt en interpreteert.
Hoe u een correlatiematrix maakt in Google Spreadsheets
Laten we zeggen dat we de volgende gegevensset hebben die het gemiddelde aantal punten, rebounds en assists voor 10 basketbalspelers toont:
Om een correlatiematrix voor deze gegevensset te maken, kunnen we de functie CORREL() gebruiken met de volgende syntaxis:
COVAR(gegevens_y, gegevens_x)
De covariantiematrix voor deze gegevensset wordt weergegeven in de cellen B15:D17 , terwijl de formules die zijn gebruikt om de covariantiematrix te maken, worden weergegeven in de cellen B21:D23 hieronder:
Hoe een correlatiematrix te interpreteren
De waarden in de individuele cellen van de correlatiematrix vertellen ons de Pearson-correlatiecoëfficiënt tussen elke paarsgewijze combinatie van variabelen. Bijvoorbeeld:
Correlatie tussen punten en rebounds: -0,0464. Punten en rebounds zijn enigszins negatief gecorreleerd, maar deze waarde ligt zo dicht bij nul dat er geen sterk bewijs is voor een significant verband tussen deze twee variabelen.
Correlatie tussen punten en assists: 0,1219. Punten en assists zijn enigszins positief gecorreleerd, maar deze waarde ligt ook vrij dicht bij nul, dus er is geen sterk bewijs voor een significant verband tussen deze twee variabelen.
Correlatie tussen rebounds en assists: 0,7137. Rebounds en assists zijn sterk positief gecorreleerd. Dat wil zeggen dat spelers met meer rebounds doorgaans ook meer assists hebben.
Merk op dat de diagonale waarden van de correlatiematrix allemaal 1 zijn, omdat de correlatie tussen een variabele en zichzelf altijd 1 is. In de praktijk is dit getal niet bruikbaar om te interpreteren.
Aanvullende bronnen
Hoe een correlatiematrix te lezen
Hoe u een correlatiematrix maakt in Excel