Hoe u handmatig een pearson-correlatiecoëfficiënt kunt berekenen
Een Pearson-correlatiecoëfficiënt meet de lineaire associatie tussen twee variabelen.
Er is altijd een waarde tussen -1 en 1 nodig, waarbij:
- -1 geeft een perfect negatieve lineaire correlatie aan tussen twee variabelen
- 0 geeft aan dat er geen lineaire correlatie is tussen twee variabelen
- 1 geeft een perfect positieve lineaire correlatie aan tussen twee variabelen
De formule voor het berekenen van een Pearson-correlatiecoëfficiënt, aangeduid met r , is:
Deze zelfstudie biedt een stapsgewijs voorbeeld van hoe u handmatig een Pearson-correlatiecoëfficiënt kunt berekenen voor de volgende gegevensset:
Stap 1: Bereken het gemiddelde van X en Y
Eerst berekenen we het gemiddelde van de X- en Y-waarden:
Stap 2: Bereken het verschil tussen de gemiddelden
Vervolgens berekenen we het verschil tussen elk van de individuele waarden X en Y en hun respectieve gemiddelden:
Stap 3: Bereken de resterende waarden
Vervolgens berekenen we de resterende waarden die nodig zijn om de Pearson-correlatiecoëfficiëntformule te voltooien:
Stap 4: Bereken de bedragen
Vervolgens berekenen we de sommen van de laatste drie kolommen:
Stap 5: Bereken de Pearson-correlatiecoëfficiënt
Nu zullen we eenvoudigweg de sommen uit de vorige stap in de Pearson-correlatiecoëfficiëntformule stoppen:
De Pearson-correlatiecoëfficiënt blijkt 0,947 te zijn.
Omdat deze waarde dicht bij 1 ligt, geeft dit aan dat X en Y sterk positief gecorreleerd zijn.
Met andere woorden: naarmate de waarde van X toeneemt, neemt de waarde van Y ook op een zeer voorspelbare manier toe.
Aanvullende bronnen
Een inleiding tot de Pearson-correlatiecoëfficiënt
Hoe u een betrouwbaarheidsinterval voor een correlatiecoëfficiënt kunt vinden