So erstellen sie eine kreuztabelle mit dplyr (mit beispielen)


Sie können die folgende grundlegende Syntax verwenden, um eine Kreuztabelle mit Funktionen aus den dplyr- und Tidyr -Paketen in R zu erstellen:

 df %>%
  group_by (var1, v ar2) %>%
  tally () %>%
  spread (var1,n)

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Erstellen Sie eine einfache Kreuztabelle

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'C', 'G', 'F', 'F', 'C'),
                 dots=c(7, 7, 8, 11, 13, 15, 19, 13))

#view data frame
df

  team position points
1 AG 7
2 AG 7
3AF 8
4 AC 11
5 BG 13
6 BF 15
7 BF 19
8 BC 13

Wir können die folgende Syntax verwenden, um eine Kreuztabelle für die Variablen „Team“ und „Position“ zu erstellen:

 library (dplyr)
library (tidyr)

#produce crosstab
df %>%
group_by (team, position) %>%
tally () %>%
spread (team, n)

# A tibble: 3 x 3
  position AB
1 C 1 1
2 F 1 2
3 G 2 1

So interpretieren Sie die Kreuztabellenwerte:

  • Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „A“ gehört.
  • Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „B“ gehört.
  • Es gibt 1 Spieler, der die Position „F“ einnimmt und zum Team „A“ gehört.
  • Es gibt 2 Spieler, die eine Position „F“ haben und zum Team „B“ gehören.
  • Es gibt 2 Spieler, die die Position „G“ haben und zum Team „A“ gehören.
  • Es gibt 1 Spieler, der die Position „G“ einnimmt und zum Team „B“ gehört.

Beachten Sie, dass wir die Zeilen und Spalten der Kreuztabelle ändern können, indem wir die in der Funktion spread() verwendete Variable ändern:

 library (dplyr)
library (tidyr)

#produce crosstab with 'position' along columns
df %>%
group_by (team, position) %>%
tally () %>%
spread (position, n)

# A tibble: 2 x 4
# Groups: team [2]
  team CFG
1 A 1 1 2
2 B 1 2 1

Verwandte Themen: So verwenden Sie die Spread-Funktion in Tidyr

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere allgemeine Funktionen in dplyr ausführen:

So berechnen Sie relative Häufigkeiten mit dplyr
So wählen Sie Spalten nach Index mit dplyr aus
So löschen Sie Zeilen mit dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert