Dplyr: como usar um filtro de mensagem “não presente”
Você pode usar a seguinte sintaxe básica no dplyr para filtrar linhas em um quadro de dados que não estão em uma lista de valores:
df %>% filter (!col_name %in% c(' value1 ', ' value2 ', ' value3 ', ...))
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Filtrar linhas que não contêm um valor em uma coluna
Suponha que temos o seguinte quadro de dados em R:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
A sintaxe a seguir mostra como filtrar linhas onde o nome da equipe não é igual a “A” ou “B”:
#filter for rows where team name is not 'A' or 'B'
df %>%
filter (!team %in% c(' A ', ' B '))
team position points
1 CF 36
2 CC 41
3 DC 18
4 DC 29
Exemplo 2: Filtrar linhas que não contêm valores em múltiplas colunas
Suponha que temos o seguinte quadro de dados em R:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
A sintaxe a seguir mostra como filtrar linhas onde o nome da equipe não é igual a “A” e a posição não é igual a “C”:
#filter for rows where team name is not 'A' and position is not 'C'
df %>%
filter (!team %in% c(' A ') & !position %in% c(' C '))
team position points
1 BF 19
2 BG 24
3 CF 36
Recursos adicionais
Os tutoriais a seguir explicam como executar outras funções comuns no dplyr:
Como deletar linhas usando dplyr
Como selecionar colunas por índice usando dplyr
Como filtrar linhas contendo uma determinada string usando dplyr