Jak korzystać z funkcji n() w r (z przykładami)
Możesz użyć funkcji n() z pakietu dplyr w R, aby policzyć liczbę obserwacji w grupie.
Oto trzy popularne sposoby wykorzystania tej funkcji w praktyce:
Metoda 1: Użyj n() do zliczenia obserwacji według grup
df %>%
group_by(group_variable) %>%
summarize(count = n())
Metoda 2: Użyj n(), aby dodać kolumnę wyświetlającą obserwacje według grup
df %>%
group_by(group_variable) %>%
mutate(count = n())
Metoda 3: Użyj n() do filtrowania na podstawie obserwacji według grup
df %>%
group_by(group_variable) %>%
filter(n() > 15 )
Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych w R, która zawiera informacje o różnych koszykarzach:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'), points=c(22, 25, 25, 20, 29, 13), assists=c(10, 12, 9, 4, 11, 10), rebounds=c(9, 8, 5, 10, 14, 12)) #view data frame df team points assists rebounds 1 A 22 10 9 2 A 25 12 8 3 to 25 9 5 4 B 20 4 10 5 B 29 11 14 6 C 13 10 12
Przykład 1: Użyj n() do zliczenia obserwacji według grup
Poniższy kod pokazuje, jak używać funkcji n() z funkcją podsumowania() do zliczania liczby obserwacji na zespół :
library (dplyr) #count number of observations by team df %>% group_by(team) %>% summarize(count = n()) # A tibble: 3 x 2 team count 1 to 3 2 B 2 3 C 1
Z wyniku możemy zobaczyć:
- Zespół A pojawia się 3 razy
- Zespół B pojawia się 2 razy
- Zespół C pojawia się 1 raz
Przykład 2: Użyj n(), aby dodać kolumnę wyświetlającą obserwacje według grup
Poniższy kod pokazuje, jak używać funkcji n() z funkcją mutate() w celu dodania kolumny do ramki daty zawierającej liczbę obserwacji na zespół :
library (dplyr) #add new column that shows number of observations by team df %>% group_by(team) %>% mutate(count = n()) # A tibble: 6 x 5 # Groups: team [3] team points assists rebounds count 1 to 22 10 9 3 2 to 25 12 8 3 3 to 25 9 5 3 4 B 20 4 10 2 5 B 29 11 14 2 6 C 13 10 12 1
Nowa kolumna o nazwie Count zawiera liczbę zespołów w każdym wierszu ramki danych.
Przykład 3: Użyj n() do filtrowania na podstawie obserwacji według grupy
Poniższy kod pokazuje, jak używać funkcji n() z funkcją filter() do filtrowania ramki danych w celu wyświetlenia tylko tych wierszy, w których zespół występuje więcej niż raz:
library (dplyr) #filter rows where team count is greater than 1 df %>% group_by(team) %>% filter(n() > 1 ) # A tibble: 5 x 4 # Groups: team [2] team points assists rebounds 1 A 22 10 9 2 A 25 12 8 3 to 25 9 5 4 B 20 4 10 5 B 29 11 14
Należy pamiętać, że wynikowa ramka danych zawiera tylko wiersze, w których zespół to „A” lub „B”, ponieważ są to jedyne zespoły, których liczba jest większa niż jeden.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji w R:
Jak używać funkcjicross() w dplyr
Jak korzystać z funkcji relocate() w dplyr
Jak korzystać z funkcji plasterka() w dplyr