So berechnen sie die partielle korrelation in r


In der Statistik verwenden wir häufig den Pearson-Korrelationskoeffizienten , um die lineare Beziehung zwischen zwei Variablen zu messen.

Manchmal möchten wir jedoch die Beziehung zwischen zwei Variablen verstehen und gleichzeitig eine dritte Variable steuern .

Angenommen, wir möchten den Zusammenhang zwischen der Anzahl der Lernstunden eines Schülers und der Abschlussprüfungsnote messen und gleichzeitig die aktuelle Note des Schülers in der Klasse kontrollieren.

In diesem Fall könnten wir die partielle Korrelation verwenden, um die Beziehung zwischen den gelernten Stunden und der Abschlussprüfungsnote zu messen.

In diesem Tutorial wird erklärt, wie man eine partielle Korrelation in R berechnet.

Beispiel: Teilkorrelation in R

Angenommen, wir haben den folgenden Datenrahmen, der die aktuelle Note, die insgesamt gelernten Stunden und die Abschlussprüfungsnote für 10 Schüler anzeigt:

 #create data frame
df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80),
                 hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6),
                 examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93))

#view data frame
df

   currentGrade hours examScore
1 82 4 88
2 88 3 85
3 75 6 76
4 74 5 70
5 93 4 92
6 97 5 94
7 83 8 89
8 90 7 85
9 90 4 90
10 80 6 93

Um die teilweise Korrelation zwischen jeder paarweisen Kombination von Variablen im Datenrahmen zu berechnen, können wir die Funktion pcor() aus der ppcor-Bibliothek verwenden:

 library (ppcor)

#calculate partial correlations
pcor(df)

$estimate
             currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000

$p.value
             currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000

$statistic
             currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000

$n
[1] 10

$gp
[1] 1

$method
[1] "pearson"

So interpretieren Sie das Ergebnis:

Teilweiser Zusammenhang zwischen Lernstunden und Abschlussprüfungsnote:

Die teilweise Korrelation zwischen den gelernten Stunden und der Abschlussprüfungsnote beträgt 0,191 , was einer kleinen positiven Korrelation entspricht. Mit zunehmender Studienstundenzahl steigen tendenziell auch die Prüfungsergebnisse, sofern die aktuelle Note konstant bleibt.

Der p-Wert für diese Teilkorrelation beträgt 0,623 , was bei α = 0,05 statistisch nicht signifikant ist.

Teilweise Korrelation zwischen aktueller Note und Abschlussprüfungsnote:

Die teilweise Korrelation zwischen der aktuellen Note und der Abschlussprüfungsnote beträgt 0,736 , was einer starken positiven Korrelation entspricht. Mit steigender aktueller Note steigen tendenziell auch die Prüfungsergebnisse, sofern die Anzahl der gelernten Stunden konstant bleibt.

Der p-Wert für diese Teilkorrelation beträgt 0,024 , was bei α = 0,05 statistisch signifikant ist.

Teilweise Korrelation zwischen aktueller Note und gelernten Stunden:

Die teilweise Korrelation zwischen der aktuellen Note, den gelernten Stunden und der Note der Abschlussprüfung beträgt -0,311 , was einer leicht negativen Korrelation entspricht. Wenn die aktuelle Note steigt, sinkt tendenziell die Note der Abschlussprüfung, sofern die Note der Abschlussprüfung konstant bleibt.

Der p-Wert für diese Teilkorrelation beträgt 0,415 , was bei α = 0,05 statistisch nicht signifikant ist.

Das Ergebnis zeigt uns auch, dass die Methode zur Berechnung der Teilkorrelation „Pearson“ war.

In der Funktion pcor() könnten wir auch „kendall“ oder „pearson“ als alternative Methoden zur Berechnung von Korrelationen angeben.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:

So berechnen Sie die Spearman-Rangkorrelation in R
So berechnen Sie die Kreuzkorrelation in R
So berechnen Sie die gleitende Korrelation in R
So berechnen Sie die Punkt-Biserial-Korrelation in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert