Como adicionar uma coluna de contagem a um quadro de dados em r


Você pode usar a seguinte sintaxe básica para adicionar uma coluna de “contagem” a um quadro de dados em R:

 df %>%
  group_by(var1) %>%
  mutate(var1_count = n())

Esta sintaxe específica adiciona uma coluna chamada var1_count ao quadro de dados que contém o número de valores na coluna chamada var1 .

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: adicione uma coluna numérica em R

Suponha que temos o seguinte quadro de dados em R que contém informações sobre vários jogadores de basquete:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
                 position=c('G', 'F', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

#view data frame
df

  team position points
1 AG 18
2 AF 22
3 FY 19
4 BF 14
5 BG 14
6 BG 11
7 BF 20
8 BF 28

Podemos usar o código a seguir para adicionar uma coluna chamada team_count que contém a contagem de cada equipe:

 library (dplyr)

#add column that shows total count of each team
df %>%
  group_by(team) %>%
  mutate(team_count = n())

# A tibble: 8 x 4
# Groups: team [2]
  team position points team_count
              
1 AG 18 3
2 AF 22 3
3 FY 19 3
4 BF 14 5
5 BG 14 5
6 BG 11 5
7 BF 20 5
8 BF 28 5

Existem 3 linhas com valor de equipe A e 5 linhas com valor de equipe B.

Então:

  • Para cada linha em que team é igual a A, o valor na coluna team_count é 3 .
  • Para cada linha em que team é igual a B, o valor na coluna team_count é 5 .

Você também pode adicionar uma coluna “conta” que agrupa diversas variáveis.

Por exemplo, o código a seguir mostra como adicionar uma coluna “conta” que agrupa variáveis de equipe e posição :

 library (dplyr)

#add column that shows total count of each team and position
df %>%
  group_by(team, position) %>%
  mutate(team_pos_count = n())

# A tibble: 8 x 4
# Groups: team, position [4]
  team position points team_pos_count
                  
1 AG 18 1
2 AF 22 2
3 FY 19 2
4 BF 14 3
5 BG 14 2
6 BG 11 2
7 BF 20 3
8 BF 28 3

Pelo resultado podemos ver:

  • 1 linha que contém A na coluna da equipe e G na coluna da posição .
  • Existem 2 linhas que contêm A na coluna da equipe e F na coluna da posição .
  • Existem 3 linhas que contêm B na coluna da equipe e F na coluna da posição .
  • Existem 2 linhas que contêm B na coluna da equipe e F na coluna da posição .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como agrupar e contar com condição em R
Como contar o número de elementos na lista em R
Como selecionar linhas únicas em um quadro de dados em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *