Dplyr: hoe gebruik ik een “niet aanwezig” berichtfilter?
U kunt de volgende basissyntaxis in dplyr gebruiken om rijen in een gegevensframe te filteren die niet in een zoeklijst staan:
df %>% filter (!col_name %in% c(' value1 ', ' value2 ', ' value3 ', ...))
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Filter rijen die geen waarde in een kolom bevatten
Stel dat we het volgende dataframe in R hebben:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
De volgende syntaxis laat zien hoe u rijen filtert waarin de teamnaam niet gelijk is aan ‚A‘ of ‚B‘:
#filter for rows where team name is not 'A' or 'B'
df %>%
filter (!team %in% c(' A ', ' B '))
team position points
1 CF 36
2 CC 41
3 DC 18
4 DC 29
Voorbeeld 2: Filter rijen die geen waarden bevatten in meerdere kolommen
Stel dat we het volgende dataframe in R hebben:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'), position=c('G', 'G', 'F', 'G', 'F', 'C', 'C', 'C'), points=c(12, 14, 19, 24, 36, 41, 18, 29)) #view data frame df team position points 1 AG 12 2 AG 14 3 BF 19 4 BG 24 5 CF 36 6 CC 41 7 DC 18 8 DC 29
De volgende syntaxis laat zien hoe u rijen filtert waarin de teamnaam niet gelijk is aan ‚A‘ en de positie niet gelijk is aan ‚C‘:
#filter for rows where team name is not 'A' and position is not 'C'
df %>%
filter (!team %in% c(' A ') & !position %in% c(' C '))
team position points
1 BF 19
2 BG 24
3 CF 36
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in dplyr kunt uitvoeren:
Rijen verwijderen met dplyr
Kolommen selecteren op index met behulp van dplyr
Hoe u rijen kunt filteren die een bepaalde tekenreeks bevatten met behulp van dplyr