A: regels verwijderen die een specifieke string bevatten


U kunt de volgende syntaxis gebruiken om regels te verwijderen die een bepaalde tekenreeks bevatten in een dataframe in R:

 df[!grepl(' string ', df$column),]

Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze syntaxis met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conference=c('East', 'East', 'East', 'West', 'West', 'East'),
                 dots=c(11, 8, 10, 6, 6, 5))

#view data frame
df

  team conference points
1 A East 11
2 A East 8
3 A East 10
4 B West 6
5 B West 6
6 C East 5

Voorbeeld 1: rijen verwijderen die een specifieke tekenreeks bevatten

De volgende code laat zien hoe u alle rijen uit het gegevensframe verwijdert die ‚A‘ in de teamkolom bevatten:

 df[!grepl(' A ', df$team),]

  team conference points
4 B West 6
5 B West 6
6 C East 5

Of we kunnen alle rijen uit het dataframe verwijderen die ‚West‘ in de conferentiekolom bevatten:

 df[!grepl(' West ', df$conference),]

  team conference points
1 A East 11
2 A East 8
3 A East 10
6 C East 5

Voorbeeld 2: rijen verwijderen die een tekenreeks bevatten in een lijst

De volgende code laat zien hoe u alle rijen uit het gegevensframe verwijdert die ‚A‘ of ‚B‘ in de teamkolom bevatten:

 df[!grepl(' A|B ', df$team),]

6 C East 5

We kunnen ook een vector van strings definiëren en vervolgens alle rijen in het dataframe verwijderen die een van de vectorstrings in de teamkolom bevat:

 #define vector of strings
remove <- c(' A ', ' B ')

#remove rows that contain any string in the vector in the team column
df[!grepl( paste (remove, collapse=' | '), df$team),]

6 C East 5

Merk op dat beide methoden tot hetzelfde resultaat leiden.

Aanvullende bronnen

Rijen verwijderen met enkele of alle NA’s in R
Hoe dubbele regels in R te verwijderen
Hoe specifieke rijen in R op te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert