So berechnen sie die korrelation nach gruppen in r
Sie können die folgende grundlegende Syntax verwenden, um die Korrelation zwischen zwei Variablen nach Gruppe in R zu berechnen:
library (dplyr)
df %>%
group_by(group_var) %>%
summarize(cor=cor(var1, var2))
Diese spezielle Syntax berechnet die Korrelation zwischen var1 und var2 , gruppiert nach group_var .
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Korrelation nach Gruppe in R berechnen
Angenommen, wir haben den folgenden Datenrahmen, der Informationen über Basketballspieler verschiedener Teams enthält:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(18, 22, 19, 14, 14, 11, 20, 28),
assists=c(2, 7, 9, 3, 12, 10, 14, 21))
#view data frame
df
team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21
Wir können die folgende Syntax aus dem dplyr- Paket verwenden, um die Korrelation zwischen Punkten und Assists , gruppiert nach Team , zu berechnen:
library (dplyr)
df %>%
group_by(team) %>%
summarize(cor=cor(points, assists))
# A tibble: 2 x 2
team horn
1 A 0.603
2 B 0.982
Aus dem Ergebnis können wir sehen:
- Der Korrelationskoeffizient zwischen Punkten und Assists für Team A beträgt 0,603 .
- Der Korrelationskoeffizient zwischen Punkten und Assists für Team B beträgt 0,982 .
Da beide Korrelationskoeffizienten positiv sind, bedeutet dies, dass das Verhältnis zwischen Punkten und Assists für beide Teams positiv ist.
Verwandt: Was gilt als „starke“ Korrelation?
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:
So zählen Sie eindeutige Werte nach Gruppen in R
So berechnen Sie die Summe nach Gruppe in R
So berechnen Sie den Mittelwert pro Gruppe in R
So berechnen Sie zusammenfassende Statistiken nach Gruppen in R