Como usar a função dplyr transmute em r (com exemplos)


Você pode usar a função transmute() em R para adicionar novas variáveis calculadas a um quadro de dados e remover quaisquer variáveis existentes.

Esta função usa a seguinte sintaxe básica:

 df %>% transmute(var_new = var1 * 2)

Neste exemplo, uma nova variável chamada var_new será criada multiplicando uma variável existente chamada var1 por 2.

Os exemplos a seguir mostram como usar a função transmute() com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

Exemplo 1: Use transmute() para criar uma nova variável

O código a seguir mostra como usar transmute() para criar uma nova variável:

 library (dplyr)

#create new variable called points2
df %>% transmute(points2 = points * 2)

  points2
1,198
2,180
3,172
4,176
5,190

Os valores do ponto2 são iguais aos valores originais da coluna do ponto multiplicados por dois.

Observe que a função transmute() na verdade não modifica o quadro de dados original.

Para salvar os resultados da função transmute() em um novo quadro de dados, você deve armazená-los em uma variável:

 library (dplyr)

#store results of transmute in variable
df_points2 <- df %>% transmute(points2 = points * 2)

#view results
df_points2

  points2
1,198
2,180
3,172
4,176
5,190

Os resultados de transmute() agora são armazenados em um novo quadro de dados.

Exemplo 2: Use transmute() para criar múltiplas novas variáveis

O código a seguir mostra como usar transmute() para criar múltiplas novas variáveis a partir de variáveis existentes:

 library (dplyr)

#create multiple new variables
df %>%
 transmute(
  points2 = points * 2,
  rebounds_squared = rebounds^2,
  assists_half = assists/2,
  team_name= paste0(' team_ ', team)
)

  points2 rebounds_squared assists_half team_name
1,198,900 16.5 team_A
2 180 784 14.0 team_B
3 172 576 15.5 team_C
4 176 576 19.5 team_D
5 190 784 17.0 team_E

Observe que quatro novas variáveis foram criadas.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em R:

Como usar a função relocate() no dplyr
Como usar a função slice() no dplyr
Como filtrar por número de linha no dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *