Como adicionar colunas ao quadro de dados em r usando dplyr


Você pode usar a função mutate() do pacote dplyr para adicionar uma ou mais colunas a um quadro de dados em R.

Esta função usa a seguinte sintaxe básica:

Método 1: adicionar uma coluna no final do quadro de dados

 df %>%
mutate (new_col=c(1, 3, 3, 5, 4))

Método 2: adicionar uma coluna antes de uma coluna específica

 df %>%
mutate (new_col=c(1, 3, 3, 5, 4),
        .before=col_name)

Método 3: adicionar uma coluna após uma coluna específica

 df %>%
mutate (new_col=c(1, 3, 3, 5, 4),
        .after=col_name)

Método 4: adicionar uma coluna com base em outras colunas

 df %>%
mutate (new_col= if_else (.$col_name > 10, ' A ', ' B '))

Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 14, 19, 24, 24, 22, 30, 9),
                 assists=c(4, 6, 6, 8, 3, 7, 8, 11))

#view data frame
df

  team points assists
1 to 12 4
2 to 14 6
3 To 19 6
4 to 24 8
5 B 24 3
6 B 22 7
7 B 30 8
8 B 9 11

Exemplo 1: Adicione uma coluna no final do quadro de dados

O código a seguir mostra como adicionar uma coluna ao final do quadro de dados:

 #add 'blocks' column at end of data frame
df <- df %>%
        mutate (blocks=c(1, 3, 3, 2, 4, 3, 6, 2))

#view data frame
df

  team points assists blocks
1 to 12 4 1
2 A 14 6 3
3 A 19 6 3
4 A 24 8 2
5 B 24 3 4
6 B 22 7 3
7 B 30 8 6
8 B 9 11 2

Observe que você pode adicionar uma coluna vazia simplesmente atribuindo NA a cada valor na nova coluna:

 #add empty column at end of data frame
df <- df %>%
        mutate (blocks=NA)

#view data frame
df

  team points assists blocks
1 A 12 4 NA
2 A 14 6 NA
3 A 19 6 NA
4 A 24 8 NA
5 B 24 3 NA
6 B 22 7 NA
7 B 30 8 NA
8 B 9 11 NA

Exemplo 2: Adicione uma coluna antes de uma coluna específica

O código a seguir mostra como adicionar uma coluna antes de uma coluna específica no quadro de dados:

 #add 'blocks' column before 'points' column
df <- df %>%
        mutate (blocks=c(1, 3, 3, 2, 4, 3, 6, 2),
              .before=points)

#view data frame
df

  team blocks points assists
1 A 1 12 4
2 to 3 14 6
3 A 3 19 6
4 A 2 24 8
5 B 4 24 3
6 B 3 22 7
7 B 6 30 8
8 B 2 9 11

Exemplo 3: Adicionar uma coluna após uma coluna específica

O código a seguir mostra como adicionar uma coluna após uma coluna específica no quadro de dados:

 #add 'blocks' column after 'points' column
df <- df %>%
        mutate (blocks=c(1, 3, 3, 2, 4, 3, 6, 2),
              .after=points)

#view data frame
df

  team points blocks assists
1 to 12 1 4
2 A 14 3 6
3 A 19 3 6
4 A 24 2 8
5 B 24 4 3
6 B 22 3 7
7 B 30 6 8
8 B 9 2 11

Exemplo 4: Adicionar uma coluna com base em outras colunas

O código a seguir mostra como adicionar uma coluna com base em outra coluna no quadro de dados:

 #add 'status' column whose values depend on value in 'points' column
df <- df %>%
        mutate (status= if_else (.$points > 20, ' Good ', ' Bad '))

#view data frame
df

  team points assists status
1 A 12 4 Bad
2 A 14 6 Bad
3 A 19 6 Bad
4 A 24 8 Good
5 B 24 3 Good
6 B 22 7 Good
7 B 30 8 Good
8 B 9 11 Bad

Recursos adicionais

Os tutoriais a seguir explicam como executar outras funções comuns no dplyr:

Como renomear uma coluna por posição de índice usando dplyr
Como selecionar colunas por índice usando dplyr
Como deletar linhas usando dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *