So verwenden sie die funktion n() in r (mit beispielen)
Sie können die Funktion n() aus dem dplyr- Paket in R verwenden, um die Anzahl der Beobachtungen in einer Gruppe zu zählen.
Hier sind drei gängige Möglichkeiten, diese Funktion in der Praxis zu nutzen:
Methode 1: Verwenden Sie n(), um Beobachtungen nach Gruppe zu zählen
df %>%
group_by(group_variable) %>%
summarize(count = n())
Methode 2: Verwenden Sie n(), um eine Spalte hinzuzufügen, die Beobachtungen nach Gruppe anzeigt
df %>%
group_by(group_variable) %>%
mutate(count = n())
Methode 3: Verwenden Sie n(), um basierend auf Beobachtungen nach Gruppen zu filtern
df %>%
group_by(group_variable) %>%
filter(n() > 15 )
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird, der Informationen über verschiedene Basketballspieler enthält:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'), points=c(22, 25, 25, 20, 29, 13), assists=c(10, 12, 9, 4, 11, 10), rebounds=c(9, 8, 5, 10, 14, 12)) #view data frame df team points assists rebounds 1 A 22 10 9 2 A 25 12 8 3 to 25 9 5 4 B 20 4 10 5 B 29 11 14 6 C 13 10 12
Beispiel 1: Verwenden Sie n(), um Beobachtungen nach Gruppen zu zählen
Der folgende Code zeigt, wie die Funktion n() mit der Funktion summarise() verwendet wird, um die Anzahl der Beobachtungen pro Team zu zählen:
library (dplyr) #count number of observations by team df %>% group_by(team) %>% summarize(count = n()) # A tibble: 3 x 2 team count 1 to 3 2 B 2 3 C 1
Aus dem Ergebnis können wir sehen:
- Team A erscheint dreimal
- Team B erscheint 2 Mal
- Team C erscheint 1 Mal
Beispiel 2: Verwenden Sie n(), um eine Spalte hinzuzufügen, die Beobachtungen nach Gruppe anzeigt
Der folgende Code zeigt, wie Sie die Funktion n() mit der Funktion mutate() verwenden, um dem Datumsrahmen eine Spalte hinzuzufügen, die die Anzahl der Beobachtungen pro Team enthält:
library (dplyr) #add new column that shows number of observations by team df %>% group_by(team) %>% mutate(count = n()) # A tibble: 6 x 5 # Groups: team [3] team points assists rebounds count 1 to 22 10 9 3 2 to 25 12 8 3 3 to 25 9 5 3 4 B 20 4 10 2 5 B 29 11 14 2 6 C 13 10 12 1
Die neue Spalte namens count enthält die Anzahl der Teams für jede Zeile im Datenrahmen.
Beispiel 3: Verwenden Sie n(), um basierend auf Beobachtungen nach Gruppen zu filtern
Der folgende Code zeigt, wie Sie die Funktion n() mit der Funktion filter() verwenden, um den Datenrahmen so zu filtern, dass nur die Zeilen angezeigt werden, in denen das Team mehr als einmal vorkommt:
library (dplyr) #filter rows where team count is greater than 1 df %>% group_by(team) %>% filter(n() > 1 ) # A tibble: 5 x 4 # Groups: team [2] team points assists rebounds 1 A 22 10 9 2 A 25 12 8 3 to 25 9 5 4 B 20 4 10 5 B 29 11 14
Beachten Sie, dass der resultierende Datenrahmen nur Zeilen enthält, in denen das Team „A“ oder „B“ ist, da dies die einzigen Teams sind, deren Anzahl größer als eins ist.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere gängige Funktionen in R verwenden:
So verwenden Sie die Funktion across() in dplyr
So verwenden Sie die Funktion relocate() in dplyr
So verwenden Sie die Funktion „slice()“ in dplyr