So berechnen sie die korrelation zwischen mehreren variablen in r


Eine Möglichkeit, die Beziehung zwischen zwei Variablen zu quantifizieren, ist die Verwendung des Pearson-Korrelationskoeffizienten , der ein Maß für den linearen Zusammenhang zwischen zwei Variablen ist . Es nimmt immer einen Wert zwischen -1 und 1 an, wobei:

  • -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an
  • 0 bedeutet, dass zwischen zwei Variablen keine lineare Korrelation besteht
  • 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Variablen an

In diesem Tutorial wird erklärt, wie die Korrelation zwischen mehreren Variablen in R berechnet wird, und zwar am Beispiel des folgenden Datenrahmens:

 #create data frame
df <- data.frame(a <- c(2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23),
                 b <- c(23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43),
                 c <- c(13, 14, 14, 14, 15, 17, 18, 19, 22, 20, 24, 26),
                 d <- c(6, 6, 7, 8, 8, 8, 7, 6, 5, 3, 3, 2))

Beispiel 1: Korrelation zwischen zwei Variablen

Der folgende Code zeigt, wie die Korrelation zwischen zwei Variablen im Datenrahmen berechnet wird:

 cor(df$a, df$b)

[1] 0.9279869

Beispiel 2: Korrelation zwischen mehreren Variablen

Der folgende Code zeigt, wie die Korrelation zwischen drei Variablen im Datenrahmen berechnet wird:

 cor(df[, c(' a ', ' b ', ' c ')])

          ABC
a 1.0000000 0.9279869 0.9604329
b 0.9279869 1.0000000 0.8942139
c 0.9604329 0.8942139 1.0000000

Das Ergebnis lässt sich wie folgt interpretieren:

  • Die Korrelation zwischen a und b beträgt 0,9279869.
  • Die Korrelation zwischen a und c beträgt 0,9604329.
  • Die Korrelation zwischen b und c beträgt 0,8942139.

Beispiel 3: Korrelation zwischen allen Variablen

Der folgende Code zeigt, wie die Korrelation zwischen allen Variablen in einem Datenrahmen berechnet wird:

 cor(df)

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Beispiel 4: Korrelation nur zwischen numerischen Variablen

Der folgende Code zeigt, wie die Korrelation nur zwischen numerischen Variablen in einem Datenrahmen berechnet wird:

 cor(df[, unlist ( lapply (df, is. numeric ))])

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Beispiel 5: Zusammenhänge visualisieren

Der folgende Code zeigt, wie Sie ein paarweises Diagramm erstellen – eine Art Diagramm, mit dem Sie die Beziehung zwischen jeder paarweisen Kombination von Variablen visualisieren können:

 #load psych package
library(psych)

#create pairs plot
peers. panels (df)

Zusätzliche Ressourcen

So berechnen Sie die partielle Korrelation in R
So berechnen Sie die Punkt-Biserial-Korrelation in R
So berechnen Sie die gleitende Korrelation in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert