So berechnen sie die korrelation nach gruppen in r


Sie können die folgende grundlegende Syntax verwenden, um die Korrelation zwischen zwei Variablen nach Gruppe in R zu berechnen:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

Diese spezielle Syntax berechnet die Korrelation zwischen var1 und var2 , gruppiert nach group_var .

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Korrelation nach Gruppe in R berechnen

Angenommen, wir haben den folgenden Datenrahmen, der Informationen über Basketballspieler verschiedener Teams enthält:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

Wir können die folgende Syntax aus dem dplyr- Paket verwenden, um die Korrelation zwischen Punkten und Assists , gruppiert nach Team , zu berechnen:

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

Aus dem Ergebnis können wir sehen:

  • Der Korrelationskoeffizient zwischen Punkten und Assists für Team A beträgt 0,603 .
  • Der Korrelationskoeffizient zwischen Punkten und Assists für Team B beträgt 0,982 .

Da beide Korrelationskoeffizienten positiv sind, bedeutet dies, dass das Verhältnis zwischen Punkten und Assists für beide Teams positiv ist.

Verwandt: Was gilt als „starke“ Korrelation?

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:

So zählen Sie eindeutige Werte nach Gruppen in R
So berechnen Sie die Summe nach Gruppe in R
So berechnen Sie den Mittelwert pro Gruppe in R
So berechnen Sie zusammenfassende Statistiken nach Gruppen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert