A: controleren of de kolom een string bevat


U kunt de volgende methoden gebruiken om te controleren of een kolom van een dataframe in R een string bevat:

Methode 1: Controleer of de exacte tekenreeks in de kolom voorkomt

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Methode 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Methode 3: Tel gedeeltelijke tekenreeksexemplaren in de kolom

 sum(str_detect(df$column_name, ' partial_string '))

In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Voorbeeld 1: Controleer of er een exacte tekenreeks in de kolom bestaat

De volgende code laat zien hoe u kunt controleren of de exacte tekenreeks „Eas“ voorkomt in de conf- kolom van het dataframe:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

De uitvoer retourneert FALSE .

Dit vertelt ons dat de exacte string ‚Eas‘ niet voorkomt in de conf- kolom.

Opmerking : we hebben regex-symbolen gebruikt om de begintekens ( ^ ) en de eindtekens ( $ ) aan te geven van de tekenreeks waarnaar we op zoek waren.

Voorbeeld 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat

De volgende code laat zien hoe u kunt controleren of de gedeeltelijke tekenreeks ‚Eas‘ bestaat in de conf- kolom van het dataframe:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

De uitvoer retourneert TRUE .

Dit vertelt ons dat de gedeeltelijke string ‚Eas‘ bestaat in de conf- kolom van het dataframe.

Voorbeeld 3: Tel het aantal exemplaren van een gedeeltelijke tekenreeks in een kolom

De volgende code laat zien hoe u het aantal keren kunt tellen dat de gedeeltelijke tekenreeks „Eas“ in de conf- kolom van het dataframe verschijnt:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

De uitvoer retourneert 3 .

Dit vertelt ons dat de gedeeltelijke string ‚Eas‘ 3 keer voorkomt in de conf- kolom van het dataframe.

Gerelateerd: Hoe de str_detect() functie in R te gebruiken

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe u kolommen selecteert die een specifieke tekenreeks bevatten in R
Hoe tekens uit een string in R te verwijderen
Hoe de tekenlocatie in een string in R te vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert