Como selecionar colunas que não começam com uma string no dplyr


Você pode usar as seguintes funções do pacote dplyr em R para selecionar colunas que não começam com uma string específica:

Método 1: selecione colunas que não comecem com uma string específica

 df %>%
  select(-starts_with(" string1 "))

Método 2: selecione colunas que não comecem com uma das várias strings

 df %>%
  select(-starts_with(c(" string1 ", " string2 ", " string3 ")))

Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (store1_sales=c(12, 10, 14, 19, 22, 25, 29),
                 store1_returns=c(3, 3, 2, 4, 3, 2, 1),
                 store2_sales=c(8, 8, 12, 14, 15, 13, 12),
                 store2_returns=c(1, 2, 2, 1, 2, 1, 3),
                 promotions=c(0, 1, 1, 1, 0, 0, 1))

#view data frame
df

  store1_sales store1_returns store2_sales store2_returns promotions
1 12 3 8 1 0
2 10 3 8 2 1
3 14 2 12 2 1
4 19 4 14 1 1
5 22 3 15 2 0
6 25 2 13 1 0
7 29 1 12 3 1

Exemplo 1: Selecione colunas que não começam com uma string específica

O código a seguir mostra como usar a função -starts_with() para selecionar apenas colunas que não começam com “store1” no quadro de dados:

 library (dplyr)

#select all columns that do not start with "store1"
df %>%
  select(-starts_with(" store1 "))

  store2_sales store2_returns promotions
1 8 1 0
2 8 2 1
3 12 2 1
4 14 1 1
5 15 2 0
6 13 1 0
7 12 3 1

Observe que as duas colunas que começam com “store1” não são retornadas.

Exemplo 2: Selecione colunas que não começam com uma das várias strings

O código a seguir mostra como usar a função -starts_with() para selecionar apenas colunas que não começam com “store1” ou “prom” no quadro de dados:

 library (dplyr)

#select all columns that do not start with "store1" or "prom"
df %>%
  select(-starts_with(c(" store1 ", " prom ")))

  store2_sales store2_returns
1 8 1
2 8 2
3 12 2
4 14 1
5 15 2
6 13 1
7 12 3

Observe que as colunas que começam com “store1” ou “prom” não são retornadas.

Nota : Por padrão, a função start_with() não diferencia maiúsculas de minúsculas. Para tornar a função sensível a maiúsculas e minúsculas, use o argumento ignore.case=FALSE na função.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns usando dplyr:

Como selecionar colunas por nome usando dplyr
Como selecionar colunas por índice usando dplyr
Como usar select_if com múltiplas condições no dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *