Hoe de substringfunctie in r te gebruiken (4 voorbeelden)
De functie substring() in R kan worden gebruikt om een substring uit een karaktervector te extraheren.
Deze functie gebruikt de volgende syntaxis:
substring(text, first, last)
Goud:
- tekst: Tekenvectornaam
- eerste: het eerste element dat moet worden geëxtraheerd
- last: Het laatste element dat moet worden geëxtraheerd
Merk ook op dat de functie substr() precies hetzelfde doet, maar met iets andere argumentnamen:
substr(text, first, last)
Goud:
- x: Tekenvectornaam
- start: het eerste element dat moet worden geëxtraheerd
- stop: het laatste element dat moet worden geëxtraheerd
De voorbeelden in deze tutorial laten zien hoe u de functie substring() in de praktijk kunt gebruiken met het volgende dataframe in R:
#create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))
#view data frame
df
team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies
Voorbeeld 1: Extraheer tekens tussen bepaalde posities
De volgende code laat zien hoe u de functie substring() gebruikt om tekens tussen positie 2 en 5 van de kolom „team“ te extraheren:
#create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )
#view updated data frame
df
team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies
Merk op dat de nieuwe kolom de tekens bevat tussen posities 2 en 5 van de kolom „team“.
Voorbeeld 2: Extraheer de eerste N tekens
De volgende code laat zien hoe u de functie substring() gebruikt om de eerste drie tekens uit de kolom “team” te extraheren:
#create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )
#view updated data frame
df
team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray
Houd er rekening mee dat de nieuwe kolom de eerste drie tekens van de kolom ‚team‘ bevat.
Voorbeeld 3: Extraheer de laatste N tekens
De volgende code laat zien hoe u de functie substring() gebruikt om de laatste drie tekens uit de kolom ‚team‘ te extraheren:
#create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))
#view updated data frame
df
team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies
Houd er rekening mee dat de nieuwe kolom de laatste drie tekens van de kolom ‚team‘ bevat.
Voorbeeld 4: Vervang een subtekenreeks
De volgende code laat zien hoe u de functie substring() gebruikt om de eerste 3 tekens van de waarden in de kolom „team“ te vervangen door 3 sterretjes:
#replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "
#view updated data frame
df
team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies
Houd er rekening mee dat de eerste drie tekens van elke teamnaam zijn vervangen door sterretjes.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen met tekenreeksen in R kunt uitvoeren:
Hoe str_replace te gebruiken in R
Hoe gedeeltelijke stringmatching uit te voeren in R
Hoe tekenreeksen naar datums in R te converteren
Hoe teken naar numeriek te converteren in R