Jak korzystać z funkcji n() w r (z przykładami)


Możesz użyć funkcji n() z pakietu dplyr w R, aby policzyć liczbę obserwacji w grupie.

Oto trzy popularne sposoby wykorzystania tej funkcji w praktyce:

Metoda 1: Użyj n() do zliczenia obserwacji według grup

 df %>%
  group_by(group_variable) %>%
  summarize(count = n())

Metoda 2: Użyj n(), aby dodać kolumnę wyświetlającą obserwacje według grup

 df %>%
  group_by(group_variable) %>%
  mutate(count = n())

Metoda 3: Użyj n() do filtrowania na podstawie obserwacji według grup

 df %>%
  group_by(group_variable) %>%
  filter(n() > 15 )

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych w R, która zawiera informacje o różnych koszykarzach:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 points=c(22, 25, 25, 20, 29, 13),
                 assists=c(10, 12, 9, 4, 11, 10),
                 rebounds=c(9, 8, 5, 10, 14, 12))

#view data frame
df

  team points assists rebounds
1 A 22 10 9
2 A 25 12 8
3 to 25 9 5
4 B 20 4 10
5 B 29 11 14
6 C 13 10 12

Przykład 1: Użyj n() do zliczenia obserwacji według grup

Poniższy kod pokazuje, jak używać funkcji n() z funkcją podsumowania() do zliczania liczby obserwacji na zespół :

 library (dplyr)

#count number of observations by team
df %>%
  group_by(team) %>%
  summarize(count = n())

# A tibble: 3 x 2
  team count
   
1 to 3
2 B 2
3 C 1

Z wyniku możemy zobaczyć:

  • Zespół A pojawia się 3 razy
  • Zespół B pojawia się 2 razy
  • Zespół C pojawia się 1 raz

Przykład 2: Użyj n(), aby dodać kolumnę wyświetlającą obserwacje według grup

Poniższy kod pokazuje, jak używać funkcji n() z funkcją mutate() w celu dodania kolumny do ramki daty zawierającej liczbę obserwacji na zespół :

 library (dplyr)

#add new column that shows number of observations by team
df %>%
  group_by(team) %>%
  mutate(count = n())

# A tibble: 6 x 5
# Groups: team [3]
  team points assists rebounds count
            
1 to 22 10 9 3
2 to 25 12 8 3
3 to 25 9 5 3
4 B 20 4 10 2
5 B 29 11 14 2
6 C 13 10 12 1

Nowa kolumna o nazwie Count zawiera liczbę zespołów w każdym wierszu ramki danych.

Przykład 3: Użyj n() do filtrowania na podstawie obserwacji według grupy

Poniższy kod pokazuje, jak używać funkcji n() z funkcją filter() do filtrowania ramki danych w celu wyświetlenia tylko tych wierszy, w których zespół występuje więcej niż raz:

 library (dplyr)

#filter rows where team count is greater than 1
df %>%
  group_by(team) %>%
  filter(n() > 1 )

# A tibble: 5 x 4
# Groups: team [2]
  team points assists rebounds
           
1 A 22 10 9
2 A 25 12 8
3 to 25 9 5
4 B 20 4 10
5 B 29 11 14

Należy pamiętać, że wynikowa ramka danych zawiera tylko wiersze, w których zespół to „A” lub „B”, ponieważ są to jedyne zespoły, których liczba jest większa niż jeden.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji w R:

Jak używać funkcjicross() w dplyr
Jak korzystać z funkcji relocate() w dplyr
Jak korzystać z funkcji plasterka() w dplyr

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *