So verwenden sie die funktion n() in r (mit beispielen)


Sie können die Funktion n() aus dem dplyr- Paket in R verwenden, um die Anzahl der Beobachtungen in einer Gruppe zu zählen.

Hier sind drei gängige Möglichkeiten, diese Funktion in der Praxis zu nutzen:

Methode 1: Verwenden Sie n(), um Beobachtungen nach Gruppe zu zählen

 df %>%
  group_by(group_variable) %>%
  summarize(count = n())

Methode 2: Verwenden Sie n(), um eine Spalte hinzuzufügen, die Beobachtungen nach Gruppe anzeigt

 df %>%
  group_by(group_variable) %>%
  mutate(count = n())

Methode 3: Verwenden Sie n(), um basierend auf Beobachtungen nach Gruppen zu filtern

 df %>%
  group_by(group_variable) %>%
  filter(n() > 15 )

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird, der Informationen über verschiedene Basketballspieler enthält:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 points=c(22, 25, 25, 20, 29, 13),
                 assists=c(10, 12, 9, 4, 11, 10),
                 rebounds=c(9, 8, 5, 10, 14, 12))

#view data frame
df

  team points assists rebounds
1 A 22 10 9
2 A 25 12 8
3 to 25 9 5
4 B 20 4 10
5 B 29 11 14
6 C 13 10 12

Beispiel 1: Verwenden Sie n(), um Beobachtungen nach Gruppen zu zählen

Der folgende Code zeigt, wie die Funktion n() mit der Funktion summarise() verwendet wird, um die Anzahl der Beobachtungen pro Team zu zählen:

 library (dplyr)

#count number of observations by team
df %>%
  group_by(team) %>%
  summarize(count = n())

# A tibble: 3 x 2
  team count
   
1 to 3
2 B 2
3 C 1

Aus dem Ergebnis können wir sehen:

  • Team A erscheint dreimal
  • Team B erscheint 2 Mal
  • Team C erscheint 1 Mal

Beispiel 2: Verwenden Sie n(), um eine Spalte hinzuzufügen, die Beobachtungen nach Gruppe anzeigt

Der folgende Code zeigt, wie Sie die Funktion n() mit der Funktion mutate() verwenden, um dem Datumsrahmen eine Spalte hinzuzufügen, die die Anzahl der Beobachtungen pro Team enthält:

 library (dplyr)

#add new column that shows number of observations by team
df %>%
  group_by(team) %>%
  mutate(count = n())

# A tibble: 6 x 5
# Groups: team [3]
  team points assists rebounds count
            
1 to 22 10 9 3
2 to 25 12 8 3
3 to 25 9 5 3
4 B 20 4 10 2
5 B 29 11 14 2
6 C 13 10 12 1

Die neue Spalte namens count enthält die Anzahl der Teams für jede Zeile im Datenrahmen.

Beispiel 3: Verwenden Sie n(), um basierend auf Beobachtungen nach Gruppen zu filtern

Der folgende Code zeigt, wie Sie die Funktion n() mit der Funktion filter() verwenden, um den Datenrahmen so zu filtern, dass nur die Zeilen angezeigt werden, in denen das Team mehr als einmal vorkommt:

 library (dplyr)

#filter rows where team count is greater than 1
df %>%
  group_by(team) %>%
  filter(n() > 1 )

# A tibble: 5 x 4
# Groups: team [2]
  team points assists rebounds
           
1 A 22 10 9
2 A 25 12 8
3 to 25 9 5
4 B 20 4 10
5 B 29 11 14

Beachten Sie, dass der resultierende Datenrahmen nur Zeilen enthält, in denen das Team „A“ oder „B“ ist, da dies die einzigen Teams sind, deren Anzahl größer als eins ist.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Funktionen in R verwenden:

So verwenden Sie die Funktion across() in dplyr
So verwenden Sie die Funktion relocate() in dplyr
So verwenden Sie die Funktion „slice()“ in dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert