A: controleren of de kolom een string bevat
U kunt de volgende methoden gebruiken om te controleren of een kolom van een dataframe in R een string bevat:
Methode 1: Controleer of de exacte tekenreeks in de kolom voorkomt
sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0
Methode 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat
sum(str_detect(df$column_name, ' partial_string ')) > 0
Methode 3: Tel gedeeltelijke tekenreeksexemplaren in de kolom
sum(str_detect(df$column_name, ' partial_string '))
In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
dots=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19
Voorbeeld 1: Controleer of er een exacte tekenreeks in de kolom bestaat
De volgende code laat zien hoe u kunt controleren of de exacte tekenreeks „Eas“ voorkomt in de conf- kolom van het dataframe:
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, ' ^Eas$ ')) > 0 [1] FALSE
De uitvoer retourneert FALSE .
Dit vertelt ons dat de exacte string ‚Eas‘ niet voorkomt in de conf- kolom.
Opmerking : we hebben regex-symbolen gebruikt om de begintekens ( ^ ) en de eindtekens ( $ ) aan te geven van de tekenreeks waarnaar we op zoek waren.
Voorbeeld 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat
De volgende code laat zien hoe u kunt controleren of de gedeeltelijke tekenreeks ‚Eas‘ bestaat in de conf- kolom van het dataframe:
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, ' Eas ')) > 0 [1] TRUE
De uitvoer retourneert TRUE .
Dit vertelt ons dat de gedeeltelijke string ‚Eas‘ bestaat in de conf- kolom van het dataframe.
Voorbeeld 3: Tel het aantal exemplaren van een gedeeltelijke tekenreeks in een kolom
De volgende code laat zien hoe u het aantal keren kunt tellen dat de gedeeltelijke tekenreeks „Eas“ in de conf- kolom van het dataframe verschijnt:
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, ' Eas ')) [1] 3
De uitvoer retourneert 3 .
Dit vertelt ons dat de gedeeltelijke string ‚Eas‘ 3 keer voorkomt in de conf- kolom van het dataframe.
Gerelateerd: Hoe de str_detect() functie in R te gebruiken
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe u kolommen selecteert die een specifieke tekenreeks bevatten in R
Hoe tekens uit een string in R te verwijderen
Hoe de tekenlocatie in een string in R te vinden