So erstellen sie eine häufigkeitstabelle nach gruppen in r


Sie können die folgenden Funktionen aus dem dplyr- Paket verwenden, um eine Häufigkeitstabelle nach Gruppen in R zu erstellen:

 library (dplyr)

df %>%
  group_by (var1, var2) %>%
  summarize (Freq=n())

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Erstellen Sie eine Häufigkeitstabelle nach Gruppe

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'G', 'F', 'G', 'F', 'F', 'C'))

#view data frame
df

  team position
1 AG
2 AG
3 AG
4 AF
5 BG
6 BF
7 BF
8 BC

Nehmen wir an, wir möchten eine Häufigkeitstabelle erstellen, die die Häufigkeit jeder Position, gruppiert nach Team, zeigt.

Wir können dazu die folgende Syntax verwenden:

 library (dplyr)

#calculate frequency of position, grouped by team
df %>%
group_by (team, position) %>%
summarize (Freq=n())

# A tibble: 5 x 3
# Groups: team [2]
  team position Freq
       
1 AF 1
2 AG 3
3 BC 1
4 BF 2
5 BG 1

So interpretieren Sie das Ergebnis:

  • 1 Spieler von Team A besetzt Position „F“
  • 3 Spieler von Team A haben Position „G“
  • 1 Spieler von Team B besetzt Position „C“
  • 2 Spieler von Team B haben Position „F“
  • 1 Spieler von Team B besetzt Position „G“

Beachten Sie, dass wir die Spalte, die die Häufigkeiten enthält, umbenennen können, indem wir den Variablennamen in der Funktion summary() ändern.

Beispielsweise könnten wir die Spalte stattdessen in „Anzahl“ umbenennen:

 library (dplyr)

#calculate frequency of position, grouped by team
df %>%
  group_by (team, position) %>%
  summarize (count=n())

# A tibble: 5 x 3
# Groups: team [2]
  team position count
       
1 AF 1
2 AG 3
3 BC 1
4 BF 2
5 BG 1

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere allgemeine Funktionen in dplyr ausführen:

So berechnen Sie relative Häufigkeiten mit dplyr
So sortieren Sie Variablen mit dplyr nach Gruppen
So wählen Sie Spalten nach Index mit dplyr aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert