Dplyr: как использовать фильтр сообщений «нет присутствия»


Вы можете использовать следующий базовый синтаксис в dplyr для фильтрации строк во фрейме данных, которых нет в списке значений:

 df %>%
  filter (!col_name %in% c(' value1 ', ' value2 ', ' value3 ', ...))

Следующие примеры показывают, как использовать этот синтаксис на практике.

Пример 1. Фильтрация строк, которые не содержат значения в столбце

Предположим, у нас есть следующий кадр данных в R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'),
                 position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'),
                 points=c(12, 14, 19, 24, 36, 41, 18, 29))

#view data frame
df

  team position points
1 AG 12
2 AG 14
3 BF 19
4 BG 24
5 CF 36
6 CC 41
7 DC 18
8 DC 29

Следующий синтаксис показывает, как фильтровать строки, в которых имя команды не равно «A» или «B»:

 #filter for rows where team name is not 'A' or 'B'
df %>%
filter (!team %in% c(' A ', ' B '))

team position points
1 CF 36
2 CC 41
3 DC 18
4 DC 29

Пример 2. Фильтрация строк, не содержащих значений в нескольких столбцах

Предположим, у нас есть следующий кадр данных в R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'),
                 position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'),
                 points=c(12, 14, 19, 24, 36, 41, 18, 29))

#view data frame
df

  team position points
1 AG 12
2 AG 14
3 BF 19
4 BG 24
5 CF 36
6 CC 41
7 DC 18
8 DC 29

Следующий синтаксис показывает, как фильтровать строки, в которых название команды не равно «A» , а позиция не равна «C»:

 #filter for rows where team name is not 'A' and position is not 'C'
df %>%
filter (!team %in% c(' A ') & !position %in% c(' C '))

team position points
1 BF 19
2 BG 24
3 CF 36

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные функции в dplyr:

Как удалить строки с помощью dplyr
Как выбрать столбцы по индексу с помощью dplyr
Как фильтровать строки, содержащие определенную строку, с помощью dplyr

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *