So erstellen sie eine kreuztabelle mit dplyr (mit beispielen)

Von Dr. Benjamin Anderson Juli 23, 2023 Führung Keine Kommentare

Sie können die folgende grundlegende Syntax verwenden, um eine Kreuztabelle mit Funktionen aus den dplyr- und Tidyr -Paketen in R zu erstellen:

 df %>%
  group_by (var1, v ar2) %>%
  tally () %>%
  spread (var1,n)

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Erstellen Sie eine einfache Kreuztabelle

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'C', 'G', 'F', 'F', 'C'),
                 dots=c(7, 7, 8, 11, 13, 15, 19, 13))

#view data frame
df

  team position points
1 AG 7
2 AG 7
3AF 8
4 AC 11
5 BG 13
6 BF 15
7 BF 19
8 BC 13

Wir können die folgende Syntax verwenden, um eine Kreuztabelle für die Variablen „Team“ und „Position“ zu erstellen:

 library (dplyr)
library (tidyr)

#produce crosstab
df %>%
group_by (team, position) %>%
tally () %>%
spread (team, n)

# A tibble: 3 x 3
  position AB
1 C 1 1
2 F 1 2
3 G 2 1

So interpretieren Sie die Kreuztabellenwerte:

Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „A“ gehört.
Es gibt 1 Spieler, der Position „C“ einnimmt und zum Team „B“ gehört.
Es gibt 1 Spieler, der die Position „F“ einnimmt und zum Team „A“ gehört.
Es gibt 2 Spieler, die eine Position „F“ haben und zum Team „B“ gehören.
Es gibt 2 Spieler, die die Position „G“ haben und zum Team „A“ gehören.
Es gibt 1 Spieler, der die Position „G“ einnimmt und zum Team „B“ gehört.

Beachten Sie, dass wir die Zeilen und Spalten der Kreuztabelle ändern können, indem wir die in der Funktion spread() verwendete Variable ändern:

 library (dplyr)
library (tidyr)

#produce crosstab with 'position' along columns
df %>%
group_by (team, position) %>%
tally () %>%
spread (position, n)

# A tibble: 2 x 4
# Groups: team [2]
  team CFG
1 A 1 1 2
2 B 1 2 1

Verwandte Themen: So verwenden Sie die Spread-Funktion in Tidyr

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere allgemeine Funktionen in dplyr ausführen:

So berechnen Sie relative Häufigkeiten mit dplyr
So wählen Sie Spalten nach Index mit dplyr aus
So löschen Sie Zeilen mit dplyr

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Beispiel 1: Erstellen Sie eine einfache Kreuztabelle

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen