Hoe de p-waarde van de correlatiecoëfficiënt in r te vinden
De correlatiecoëfficiënt van Pearson kan worden gebruikt om de lineaire associatie tussen twee variabelen te meten.
Deze correlatiecoëfficiënt heeft altijd een waarde tussen -1 en 1 waarbij:
- -1 : Perfect negatieve lineaire correlatie tussen twee variabelen.
- 0 : Geen lineaire correlatie tussen twee variabelen.
- 1: Perfect positieve lineaire correlatie tussen twee variabelen.
Om te bepalen of een correlatiecoëfficiënt statistisch significant is, kun je de bijbehorende t-score en p-waarde berekenen.
De formule voor het berekenen van de t-score van een correlatiecoëfficiënt (r) is:
t = r√ n-2 / √ 1-r 2
De p-waarde wordt berekend als de overeenkomstige tweezijdige p-waarde voor de t-verdeling met n-2 vrijheidsgraden.
Om de p-waarde van een Pearson-correlatiecoëfficiënt in R te berekenen, kunt u de functie cor.test() gebruiken.
horn. test (x,y)
Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld: Bereken de P-waarde voor de correlatiecoëfficiënt in R
De volgende code laat zien hoe u de functie cor.test() gebruikt om de p-waarde van de correlatiecoëfficiënt tussen twee variabelen in R te berekenen:
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate correlation coefficient and corresponding p-value
horn. test (x,y)
Pearson's product-moment correlation
data: x and y
t = -1.7885, df = 8, p-value = 0.1115
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8709830 0.1434593
sample estimates:
horn
-0.5344408
Uit het resultaat kunnen we zien:
- De Pearson-correlatiecoëfficiënt is -0,5344408 .
- De overeenkomstige p-waarde is 0,1115 .
Omdat de correlatiecoëfficiënt negatief is, geeft dit aan dat er een negatief lineair verband bestaat tussen de twee variabelen.
Omdat de p-waarde van de correlatiecoëfficiënt echter niet kleiner is dan 0,05, is de correlatie niet statistisch significant.
Merk op dat we ook cor.test(x, y)$p.value kunnen typen om alleen de p-waarde voor de correlatiecoëfficiënt te extraheren:
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate p-value for correlation between x and y
horn. test (x, y)$p.value
[1] 0.1114995
De p-waarde voor de correlatiecoëfficiënt is 0,1114995 .
Dit komt overeen met de p-waarde van de vorige uitvoer.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe de gedeeltelijke correlatie in R te berekenen
Hoe de Spearman-correlatie in R te berekenen
Hoe de glijdende correlatie in R te berekenen