Hoe de spearman-rangcorrelatie in r te berekenen
In de statistiek verwijst correlatie naar de sterkte en richting van een verband tussen twee variabelen. De waarde van een correlatiecoëfficiënt kan variëren van -1 tot 1, met de volgende interpretaties:
- -1: een perfect negatief verband tussen twee variabelen
- 0: geen verband tussen twee variabelen
- 1: een perfecte positieve relatie tussen twee variabelen
Een speciaal type correlatie wordt de rangcorrelatie van Spearman genoemd, die wordt gebruikt om de correlatie tussen twee gerangschikte variabelen te meten. (bijvoorbeeld de rangorde van de wiskunde-examenscore van een leerling in verhouding tot de rangorde van de wetenschapsexamenscore in een klas).
Om de Spearman-rangcorrelatie tussen twee variabelen in R te berekenen, kunnen we de volgende basissyntaxis gebruiken:
corr <- cor. test (x, y, method = ' spearman ')
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Correlatie van Spearman-rangen tussen vectoren
De volgende code laat zien hoe u de Spearman-rangcorrelatie tussen twee vectoren in R kunt berekenen:
#define data
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate Spearman rank correlation between x and y
horn. test (x, y, method = ' spearman ')
Spearman's rank correlation rho
data: x and y
S = 234, p-value = 0.2324
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
-0.4181818
Uit het resultaat kunnen we zien dat de Spearman-rangcorrelatie -0,41818 is en de overeenkomstige p-waarde 0,2324 .
Dit geeft aan dat er een negatieve correlatie bestaat tussen de twee vectoren.
Omdat de p-waarde van de correlatie echter niet kleiner is dan 0,05, is de correlatie niet statistisch significant.
Voorbeeld 2: Spearman-rangcorrelatie tussen kolommen in het gegevensframe
De volgende code laat zien hoe u de Spearman-rangcorrelatie tussen twee kolommen in een gegevensframe kunt berekenen:
#define data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'),
points=c(67, 70, 75, 78, 73, 89, 84, 99, 90, 91),
assists=c(22, 27, 30, 23, 25, 31, 38, 35, 34, 32))
#calculate Spearman rank correlation between x and y
horn. test (df$points, df$assists, method = 'spearman')
Spearman's rank correlation rho
data: df$points and df$assists
S = 36, p-value = 0.01165
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.7818182
Uit het resultaat kunnen we zien dat de Spearman-rangcorrelatie 0,7818 is en de overeenkomstige p-waarde 0,01165 .
Dit geeft aan dat er een sterke positieve correlatie bestaat tussen de twee vectoren.
Omdat de p-waarde van de correlatie kleiner is dan 0,05, is de correlatie statistisch significant.
Aanvullende bronnen
Hoe de gedeeltelijke correlatie in R te berekenen
Hoe autocorrelatie in R te berekenen
Hoe de glijdende correlatie in R te berekenen
Hoe Spearman-correlatie in APA-formaat te rapporteren