Hoe polychorische correlatie in r te berekenen
Polychorische correlatie wordt gebruikt om de correlatie tussen ordinale variabelen te berekenen.
Bedenk dat ordinale variabelen variabelen zijn waarvan de mogelijke waarden categorisch zijn en een natuurlijke volgorde hebben.
Hier zijn enkele voorbeelden van variabelen gemeten op een ordinale schaal:
- Tevredenheid : Zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden
- Inkomensniveau : laag inkomen, middeninkomen, hoog inkomen
- Status functielocatie : Entry Analist, Analist I, Analist II, Senior Analist
- Pijnniveau : lage hoeveelheid, gemiddelde hoeveelheid, hoge hoeveelheid
De waarde van de polychorische correlatie varieert van -1 tot 1 waarbij:
- -1 geeft een perfecte negatieve correlatie aan
- 0 geeft aan dat er geen correlatie is
- 1 geeft een perfecte positieve correlatie aan
We kunnen de functie polychor(x, y) uit het polycor- pakket gebruiken om de polychorische correlatie tussen twee ordinale variabelen in R te berekenen.
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Bereken polychorische correlatie voor filmbeoordelingen
Stel dat u wilt weten of er bij twee verschillende filmbeoordelingsbureaus een hoge correlatie bestaat tussen hun filmbeoordelingen.
We vragen elk bureau om 20 verschillende films te beoordelen op een schaal van 1 tot 3, waarbij:
- 1 geeft “slecht” aan
- 2 geeft “arm” aan
- 3 geeft “goed” aan
We kunnen de volgende code in R gebruiken om de polychorische correlatie tussen de beoordelingen van de twee bureaus te berekenen:
library (polycor) #define movie ratings for each agency agency1 <- c(1, 1, 2, 2, 3, 2, 2, 3, 2, 3, 3, 2, 1, 2, 2, 1, 1, 1, 2, 2) agency2 <- c(1, 1, 2, 1, 3, 3, 3, 2, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 3, 3) #calculate polychoric correlation between ratings polychor(agency1, agency2) [1] 0.7828328
De polychorische correlatie blijkt 0,78 te zijn.
Deze waarde is vrij hoog, wat aangeeft dat er een sterk positief verband bestaat tussen de beoordelingen van elk bureau.
Voorbeeld 2: Bereken polychorische correlatie voor restaurantrecensies
Stel dat u wilt weten of twee verschillende buurtrestaurants een verband hebben tussen de klantbeoordelingen van hun restaurants.
We doen willekeurig onderzoek onder twintig klanten die in de twee restaurants hebben gegeten en vragen hen hun algehele tevredenheid te beoordelen op een schaal van 1 tot 5, waarbij:
- 1 staat voor “zeer ontevreden”
- 2 betekent “ontevreden”
- 3 geeft “neutraal” aan
- 4 betekent “tevreden”
- 5 betekent “zeer tevreden”
We kunnen de volgende code in R gebruiken om de polychorische correlatie tussen de beoordelingen van de twee restaurants te berekenen:
library (polycor) #define ratings for each restaurant restaurant1 <- c(1, 1, 2, 2, 2, 3, 3, 3, 2, 2, 3, 4, 4, 5, 5, 4, 3, 4, 5, 5) restaurant2 <- c(4, 3, 3, 4, 3, 3, 4, 5, 4, 4, 4, 5, 5, 4, 2, 1, 1, 2, 1, 4) #calculate polychoric correlation between ratings polychor(restaurant1, restaurant2) [1] -0.1322774
De polychorische correlatie blijkt -0,13 te zijn.
Deze waarde ligt dicht bij nul, wat aangeeft dat er weinig of geen verband bestaat tussen restaurantbeoordelingen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veel voorkomende correlatiecoëfficiënten in R kunt berekenen:
Hoe de Spearman-rangcorrelatie in R te berekenen
Hoe de punt-biseriële correlatie in R te berekenen
Hoe kruiscorrelatie in R te berekenen
Hoe de glijdende correlatie in R te berekenen
Hoe de gedeeltelijke correlatie in R te berekenen