Jak liczyć obserwacje na grupę w r


Często możesz być zainteresowany policzeniem liczby obserwacji na grupę w R.

Na szczęście można to łatwo zrobić, korzystając z funkcji count() biblioteki dplyr .

W tym samouczku wyjaśniono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu następującej ramki danych:

 #create data frame
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#view data frame
df

   team position points
1 GA 4
2 AG 13
3AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 GC 21
10 CF 22
11 CF 25
12 CF 31

Przykład 1: liczenie według zmiennej

Poniższy kod pokazuje, jak policzyć całkowitą liczbę graczy w drużynie:

 library (dplyr)

#count total observations by variable 'team'
df %>% count(team)

# A tibble: 3 x 2
  team n
   
1 to 3
2 B 5
3 C 4

Z wyniku możemy zobaczyć, że:

  • Drużyna A składa się z 3 zawodników
  • Drużyna B składa się z 5 zawodników
  • Drużyna C składa się z 4 zawodników

Ta pojedyncza funkcja count() daje nam niezłe pojęcie o rozmieszczeniu graczy w drużynie.

Pamiętaj, że możemy również sortować liczby, jeśli chcemy:

 #count total observations by variable 'team'
df %>% count(team, sort= TRUE )

# A tibble: 3 x 2
  team n
   
1 B 5
2 C 4
3 to 3

Przykład 2: Liczenie według kilku zmiennych

Możemy również sortować według kilku zmiennych:

 #count total observations by 'team' and 'position'
df %>% count(team, position)

# A tibble: 6 x 3
  team position n
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1

Z wyniku możemy zobaczyć, że:

  • Drużyna A składa się z 1 zawodnika na pozycji „F” (napastnik) i 2 zawodników na pozycji „G” (obrona).
  • Drużyna B składa się z 3 zawodników na pozycji „F” (napastnik) i 2 zawodników na pozycji „G” (obrona).
  • Drużyna C składa się z 3 zawodników na pozycji „F” (napastnik) i 1 zawodnika na pozycji „G” (obrona).

Przykład 3: liczba ważona

Możemy również „zważyć” liczebność jednej zmiennej inną zmienną. Na przykład poniższy kod pokazuje, jak policzyć całkowitą liczbę obserwacji na zespół, używając zmiennej „punkty” jako wagi:

 df %>% count(team, wt= points )

# A tibble: 3 x 2
  team n
   
1 to 24
2 B 64
3 C 99

Pełną dokumentację funkcji count() znajdziesz tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *