Hoe de p-waarde van de correlatiecoëfficiënt in r te vinden


De correlatiecoëfficiënt van Pearson kan worden gebruikt om de lineaire associatie tussen twee variabelen te meten.

Deze correlatiecoëfficiënt heeft altijd een waarde tussen -1 en 1 waarbij:

  • -1 : Perfect negatieve lineaire correlatie tussen twee variabelen.
  • 0 : Geen lineaire correlatie tussen twee variabelen.
  • 1: Perfect positieve lineaire correlatie tussen twee variabelen.

Om te bepalen of een correlatiecoëfficiënt statistisch significant is, kun je de bijbehorende t-score en p-waarde berekenen.

De formule voor het berekenen van de t-score van een correlatiecoëfficiënt (r) is:

t = r√ n-2 / √ 1-r 2

De p-waarde wordt berekend als de overeenkomstige tweezijdige p-waarde voor de t-verdeling met n-2 vrijheidsgraden.

Om de p-waarde van een Pearson-correlatiecoëfficiënt in R te berekenen, kunt u de functie cor.test() gebruiken.

 horn. test (x,y)

Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld: Bereken de P-waarde voor de correlatiecoëfficiënt in R

De volgende code laat zien hoe u de functie cor.test() gebruikt om de p-waarde van de correlatiecoëfficiënt tussen twee variabelen in R te berekenen:

 #create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate correlation coefficient and corresponding p-value
horn. test (x,y)

	Pearson's product-moment correlation

data: x and y
t = -1.7885, df = 8, p-value = 0.1115
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.8709830 0.1434593
sample estimates:
       horn 
-0.5344408

Uit het resultaat kunnen we zien:

  • De Pearson-correlatiecoëfficiënt is -0,5344408 .
  • De overeenkomstige p-waarde is 0,1115 .

Omdat de correlatiecoëfficiënt negatief is, geeft dit aan dat er een negatief lineair verband bestaat tussen de twee variabelen.

Omdat de p-waarde van de correlatiecoëfficiënt echter niet kleiner is dan 0,05, is de correlatie niet statistisch significant.

Merk op dat we ook cor.test(x, y)$p.value kunnen typen om alleen de p-waarde voor de correlatiecoëfficiënt te extraheren:

 #create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate p-value for correlation between x and y
horn. test (x, y)$p.value

[1] 0.1114995

De p-waarde voor de correlatiecoëfficiënt is 0,1114995 .

Dit komt overeen met de p-waarde van de vorige uitvoer.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe de gedeeltelijke correlatie in R te berekenen
Hoe de Spearman-correlatie in R te berekenen
Hoe de glijdende correlatie in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert