Dplyr: как использовать фильтр сообщений «нет присутствия»
Вы можете использовать следующий базовый синтаксис в dplyr для фильтрации строк во фрейме данных, которых нет в списке значений:
df %>% filter (!col_name %in% c(' value1 ', ' value2 ', ' value3 ', ...))
Следующие примеры показывают, как использовать этот синтаксис на практике.
Пример 1. Фильтрация строк, которые не содержат значения в столбце
Предположим, у нас есть следующий кадр данных в R:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
Следующий синтаксис показывает, как фильтровать строки, в которых имя команды не равно «A» или «B»:
#filter for rows where team name is not 'A' or 'B'
df %>%
filter (!team %in% c(' A ', ' B '))
team position points
1 CF 36
2 CC 41
3 DC 18
4 DC 29
Пример 2. Фильтрация строк, не содержащих значений в нескольких столбцах
Предположим, у нас есть следующий кадр данных в R:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
Следующий синтаксис показывает, как фильтровать строки, в которых название команды не равно «A» , а позиция не равна «C»:
#filter for rows where team name is not 'A' and position is not 'C'
df %>%
filter (!team %in% c(' A ') & !position %in% c(' C '))
team position points
1 BF 19
2 BG 24
3 CF 36
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные функции в dplyr:
Как удалить строки с помощью dplyr
Как выбрать столбцы по индексу с помощью dplyr
Как фильтровать строки, содержащие определенную строку, с помощью dplyr