Jak dodać kolumnę zliczającą do ramki danych w r


Możesz użyć następującej podstawowej składni, aby dodać kolumnę „count” do ramki danych w R:

 df %>%
  group_by(var1) %>%
  mutate(var1_count = n())

Ta konkretna składnia dodaje kolumnę o nazwie var1_count do ramki danych, która zawiera liczbę wartości w kolumnie o nazwie var1 .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: dodaj kolumnę liczbową w R

Załóżmy, że mamy następującą ramkę danych w R, która zawiera informacje o różnych koszykarzach:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
                 position=c('G', 'F', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

#view data frame
df

  team position points
1 AG 18
2 AF 22
3 FY 19
4 BF 14
5 BG 14
6 BG 11
7 BF 20
8 BF 28

Możemy użyć poniższego kodu, aby dodać kolumnę o nazwie team_count , która zawiera liczbę każdego zespołu:

 library (dplyr)

#add column that shows total count of each team
df %>%
  group_by(team) %>%
  mutate(team_count = n())

# A tibble: 8 x 4
# Groups: team [2]
  team position points team_count
              
1 AG 18 3
2 AF 22 3
3 FY 19 3
4 BF 14 5
5 BG 14 5
6 BG 11 5
7 BF 20 5
8 BF 28 5

Istnieją 3 linie o wartości zespołu A i 5 linii o wartości zespołu B.

Więc:

  • Dla każdego wiersza, w którym zespół równa się A, wartość w kolumnie team_count wynosi 3 .
  • Dla każdego wiersza, w którym drużyna równa się B, wartość w kolumnie team_count wynosi 5 .

Możesz także dodać kolumnę „konto”, która grupuje kilka zmiennych.

Na przykład poniższy kod pokazuje, jak dodać kolumnę „konto”, która grupuje zmienne dotyczące zespołu i stanowiska :

 library (dplyr)

#add column that shows total count of each team and position
df %>%
  group_by(team, position) %>%
  mutate(team_pos_count = n())

# A tibble: 8 x 4
# Groups: team, position [4]
  team position points team_pos_count
                  
1 AG 18 1
2 AF 22 2
3 FY 19 2
4 BF 14 3
5 BG 14 2
6 BG 11 2
7 BF 20 3
8 BF 28 3

Z wyniku możemy zobaczyć:

  • Jest 1 wiersz zawierający A w kolumnie zespołu i G w kolumnie pozycji .
  • Istnieją 2 wiersze zawierające literę A w kolumnie zespołu i literę F w kolumnie pozycji .
  • Istnieją 3 wiersze zawierające B w kolumnie zespołu i F w kolumnie pozycji .
  • Istnieją 2 wiersze zawierające B w kolumnie zespołu i F w kolumnie pozycji .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak grupować według i liczyć z warunkiem w R
Jak policzyć liczbę elementów na liście w R
Jak wybrać pojedyncze wiersze w ramce danych w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *