Hoe de strsplit()-functie in r te gebruiken om stringelementen te splitsen


De functie strsplit() in R kan worden gebruikt om een string in meerdere stukken te splitsen. Deze functie gebruikt de volgende syntaxis:

strsplit(tekenreeks, patroon)

Goud:

  • tekenreeks: karaktervector
  • patroon: patroon waarop moet worden verdeeld

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Een string splitsen op basis van spaties

De volgende code laat zien hoe u de functie strsplit() gebruikt om een tekenreeks te splitsen op basis van spaties:

 #split string based on spaces
split_up <- strsplit(" Hey there people ", split="")

#view results
split_up

[[1]]
[1] “Hey” “there” “people”

#view class of split_up
class(split_up)

[1] "list"

Het resultaat is een lijst met drie elementen, opgesplitst op basis van spaties in de originele string.

We kunnen de functie unlist() gebruiken als we in plaats daarvan een vector als resultaat willen produceren:

 #split string based on spaces
split_up <- unlist(strsplit(" Hey there people ", split=" "))

#view results
split_up

[1] “Hey” “there” “people”

#view class of split_up
class(split_up)

[1] “character”

We kunnen zien dat het resultaat een karaktervector is.

Voorbeeld 2: Tekenreekssplitsing op basis van een aangepast scheidingsteken

We kunnen ook de functie stplit() gebruiken om een tekenreeks te splitsen op basis van een aangepast scheidingsteken, zoals een koppelteken:

 #split string based on dashes
strsplit(" Hey-there-people ", split=" - ")

[[1]]
[1] “Hey” “there” “people”

Het resultaat is een lijst met drie elementen, opgesplitst op basis van de koppeltekens van de originele tekenreeks.

Voorbeeld 3: Een tekenreeks splitsen op basis van meerdere scheidingstekens

We kunnen ook vierkante haakjes gebruiken in het split- argument van de stplit() -functie om een tekenreeks te splitsen op basis van verschillende scheidingstekens:

 #split string based on several delimiters
strsplit(" Hey&there-you/people ", split=" [&-/] ")

[[1]]
[1] “Hey” “there” “you” “people”

Het resultaat is een lijst met elementen die zijn gesplitst wanneer een van de volgende scheidingstekens aanwezig was in de oorspronkelijke tekenreeks:

  • Ampersand ( & )
  • Streepje ( )
  • Schuine streep ( / )

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen met tekenreeksen in R kunt uitvoeren:

Hoe str_replace te gebruiken in R
Hoe gedeeltelijke stringmatching uit te voeren in R
Hoe tekenreeksen naar datums in R te converteren
Hoe teken naar numeriek te converteren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert