A: hoe strsplit() te gebruiken met meerdere scheidingstekens


U kunt de volgende basissyntaxis gebruiken met de functie strsplit() in R om een tekenreeks in stukken te splitsen op basis van meerdere scheidingstekens:

 strsplit(my_string, ' [,& ]+ ')

In dit specifieke voorbeeld wordt de tekenreeks met de naam my_string gesplitst wanneer deze een van de volgende drie scheidingstekens tegenkomt:

  • Een komma ( , )
  • Een ampersand ( & )
  • Een gebied

Houd er rekening mee dat de tekens tussen haakjes aangeven naar welke scheidingstekens moet worden gezocht, en dat het + -teken aangeeft dat er meerdere scheidingstekens in een rij kunnen staan (er kunnen bijvoorbeeld meerdere spaties in een rij staan).

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Gebruik strsplit() met meerdere scheidingstekens in R

Stel dat we de volgende string in R hebben:

 #create string
my_string <- 'this is a, string & with seven words'

Als we de functie strsplit() gebruiken om de string te splitsen telkens wanneer een spatie wordt aangetroffen, zal dit het volgende resultaat opleveren:

 #split string based on spaces
strsplit(my_string, ' ')

[[1]]
 [1] "this" "is" "a," "string" "&" "with" "" ""      
 [9] “seven” “words”

De functie strsplit() splitst de tekenreeks wanneer er een spatie wordt aangetroffen, maar kan geen komma’s, ampersands en meerdere spaties verwerken.

Om de tekenreeks te splitsen op basis van elk van deze scheidingstekens, kunnen we de volgende syntaxis gebruiken:

 #split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')

[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words" 

Deze functie kan de tekenreeks splitsen op basis van drie verschillende scheidingstekens en retourneert correct alleen de woorden in de tekenreeks waarin we geïnteresseerd zijn.

Merk op dat we in dit voorbeeld drie scheidingstekens tussen haakjes hebben opgenomen in de functie strsplit() , maar u kunt zoveel scheidingstekens opgeven als u wilt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen kunt uitvoeren met dplyr:

Hoe de strsplit()-functie in R te gebruiken om stringelementen te splitsen
Hoe je een string splitst en het eerste element in R krijgt
Hoe woorden in een string in R te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert