So erstellen sie eine kreuztabelle mit dplyr (mit beispielen)
Sie können die folgende grundlegende Syntax verwenden, um eine Kreuztabelle mit Funktionen aus den dplyr- und Tidyr -Paketen in R zu erstellen:
df %>% group_by (var1, v ar2) %>% tally () %>% spread (var1,n)
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel 1: Erstellen Sie eine einfache Kreuztabelle
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'C', 'G', 'F', 'F', 'C'), dots=c(7, 7, 8, 11, 13, 15, 19, 13)) #view data frame df team position points 1 AG 7 2 AG 7 3AF 8 4 AC 11 5 BG 13 6 BF 15 7 BF 19 8 BC 13
Wir können die folgende Syntax verwenden, um eine Kreuztabelle für die Variablen „Team“ und „Position“ zu erstellen:
library (dplyr) library (tidyr) #produce crosstab df %>% group_by (team, position) %>% tally () %>% spread (team, n) # A tibble: 3 x 3 position AB 1 C 1 1 2 F 1 2 3 G 2 1
So interpretieren Sie die Kreuztabellenwerte:
- Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „A“ gehört.
- Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „B“ gehört.
- Es gibt 1 Spieler, der die Position „F“ einnimmt und zum Team „A“ gehört.
- Es gibt 2 Spieler, die eine Position „F“ haben und zum Team „B“ gehören.
- Es gibt 2 Spieler, die die Position „G“ haben und zum Team „A“ gehören.
- Es gibt 1 Spieler, der die Position „G“ einnimmt und zum Team „B“ gehört.
Beachten Sie, dass wir die Zeilen und Spalten der Kreuztabelle ändern können, indem wir die in der Funktion spread() verwendete Variable ändern:
library (dplyr) library (tidyr) #produce crosstab with 'position' along columns df %>% group_by (team, position) %>% tally () %>% spread (position, n) # A tibble: 2 x 4 # Groups: team [2] team CFG 1 A 1 1 2 2 B 1 2 1
Verwandte Themen: So verwenden Sie die Spread-Funktion in Tidyr
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere allgemeine Funktionen in dplyr ausführen:
So berechnen Sie relative Häufigkeiten mit dplyr
So wählen Sie Spalten nach Index mit dplyr aus
So löschen Sie Zeilen mit dplyr