So zählen sie beobachtungen pro gruppe in r


Oftmals könnte es für Sie von Interesse sein, die Anzahl der Beobachtungen pro Gruppe in R zu zählen.

Glücklicherweise ist dies mit der Funktion count() der dplyr- Bibliothek einfach zu bewerkstelligen.

In diesem Tutorial werden mehrere Beispiele für die praktische Verwendung dieser Funktion anhand des folgenden Datenrahmens erläutert:

 #create data frame
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#view data frame
df

   team position points
1 GA 4
2 AG 13
3AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 GC 21
10 CF 22
11 CF 25
12 CF 31

Beispiel 1: Zählen nach einer Variablen

Der folgende Code zeigt, wie die Gesamtzahl der Spieler pro Team gezählt wird:

 library (dplyr)

#count total observations by variable 'team'
df %>% count(team)

# A tibble: 3 x 2
  team n
   
1 to 3
2 B 5
3 C 4

Aus dem Ergebnis können wir Folgendes erkennen:

  • Team A besteht aus 3 Spielern
  • Team B besteht aus 5 Spielern
  • Team C besteht aus 4 Spielern

Diese einzelne count()-Funktion gibt uns eine schöne Vorstellung von der Verteilung der Spieler pro Team.

Beachten Sie, dass wir die Anzahlen auch sortieren können, wenn wir möchten:

 #count total observations by variable 'team'
df %>% count(team, sort= TRUE )

# A tibble: 3 x 2
  team n
   
1 B 5
2 C 4
3 to 3

Beispiel 2: Zählen nach mehreren Variablen

Wir können auch nach mehreren Variablen sortieren:

 #count total observations by 'team' and 'position'
df %>% count(team, position)

# A tibble: 6 x 3
  team position n
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1

Aus dem Ergebnis können wir Folgendes erkennen:

  • Team A hat 1 Spieler auf der Position „F“ (Stürmer) und 2 Spieler auf der Position „G“ (Wächter).
  • Team B hat 3 Spieler auf der Position „F“ (Stürmer) und 2 Spieler auf der Position „G“ (Wächter).
  • Team C hat 3 Spieler auf der Position „F“ (Stürmer) und 1 Spieler auf der Position „G“ (Wächter).

Beispiel 3: gewichtete Zahl

Wir können die Anzahl einer Variablen auch durch eine andere Variable „gewichten“. Der folgende Code zeigt beispielsweise, wie die Gesamtbeobachtungen pro Team gezählt werden, wobei die Variable „points“ als Gewichtung verwendet wird:

 df %>% count(team, wt= points )

# A tibble: 3 x 2
  team n
   
1 to 24
2 B 64
3 C 99

Die vollständige Dokumentation zur count()- Funktion finden Sie hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert