Hoe de substringfunctie in r te gebruiken (4 voorbeelden)


De functie substring() in R kan worden gebruikt om een substring uit een karaktervector te extraheren.

Deze functie gebruikt de volgende syntaxis:

 substring(text, first, last)

Goud:

  • tekst: Tekenvectornaam
  • eerste: het eerste element dat moet worden geëxtraheerd
  • last: Het laatste element dat moet worden geëxtraheerd

Merk ook op dat de functie substr() precies hetzelfde doet, maar met iets andere argumentnamen:

 substr(text, first, last)

Goud:

  • x: Tekenvectornaam
  • start: het eerste element dat moet worden geëxtraheerd
  • stop: het laatste element dat moet worden geëxtraheerd

De voorbeelden in deze tutorial laten zien hoe u de functie substring() in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Voorbeeld 1: Extraheer tekens tussen bepaalde posities

De volgende code laat zien hoe u de functie substring() gebruikt om tekens tussen positie 2 en 5 van de kolom „team“ te extraheren:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Merk op dat de nieuwe kolom de tekens bevat tussen posities 2 en 5 van de kolom „team“.

Voorbeeld 2: Extraheer de eerste N tekens

De volgende code laat zien hoe u de functie substring() gebruikt om de eerste drie tekens uit de kolom “team” te extraheren:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Houd er rekening mee dat de nieuwe kolom de eerste drie tekens van de kolom ‚team‘ bevat.

Voorbeeld 3: Extraheer de laatste N tekens

De volgende code laat zien hoe u de functie substring() gebruikt om de laatste drie tekens uit de kolom ‚team‘ te extraheren:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Houd er rekening mee dat de nieuwe kolom de laatste drie tekens van de kolom ‚team‘ bevat.

Voorbeeld 4: Vervang een subtekenreeks

De volgende code laat zien hoe u de functie substring() gebruikt om de eerste 3 tekens van de waarden in de kolom „team“ te vervangen door 3 sterretjes:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Houd er rekening mee dat de eerste drie tekens van elke teamnaam zijn vervangen door sterretjes.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen met tekenreeksen in R kunt uitvoeren:

Hoe str_replace te gebruiken in R
Hoe gedeeltelijke stringmatching uit te voeren in R
Hoe tekenreeksen naar datums in R te converteren
Hoe teken naar numeriek te converteren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert