Hoe str_sub in r te gebruiken (met voorbeelden)


De functie str_sub() van het stringr- pakket in R kan worden gebruikt om substrings in een string te extraheren of te vervangen.

Deze functie gebruikt de volgende syntaxis:

str_sub(tekenreeks, begin, einde)

Goud:

  • tekenreeks: karaktervector
  • start: Positie van het eerste teken
  • einde: Positie van het laatste teken

Deze tutorial biedt verschillende voorbeelden van hoe u deze functie praktisch kunt gebruiken met het volgende dataframe:

 #create data frame
df <- data. frame (team=c('team_A', 'team_B', 'team_C', 'team_D'),
                 conference=c('West', 'West', 'East', 'East'),
                 dots=c(88, 97, 94, 104))

#view data frame
df

    team conference points
1 team_A West 88
2 team_B West 97
3 team_C East 94
4 team_D East 104

Voorbeeld 1: Extraheer een subtekenreeks uit een tekenreeks

De volgende code laat zien hoe u voor elke tekenreeks in de kolom ‚team‘ de subtekenreeks kunt extraheren die begint op positie 5 en eindigt op positie 6:

 library (stringr)

#extract characters in positions 5 through 6 of 'team' column
str_sub(string=df$team, start= 5 , end= 6 )

[1] "_A" "_B" "_C" "_D"

Voorbeeld 2: Extraheer de subtekenreeks naar een specifieke positie

De volgende code laat zien hoe u elk teken tot positie 4 kunt extraheren voor elke tekenreeks in de kolom ‚team‘:

 library (stringr)

#extract all characters up to position 4 in 'team' column
str_sub(string=df$team, end= 4 )

[1] "team" "team" "team" "team"

Voorbeeld 3: Extraheer subtekenreeks van specifieke positie

De volgende code laat zien hoe u elk teken na positie 3 kunt extraheren voor elke tekenreeks in de kolom ‚team‘:

 library (stringr)

#extract all characters after position 2 in 'team' column
str_sub(string=df$team, start= 3 )

[1] "am_A" "am_B" "am_C" "am_D"

Voorbeeld 4: Vervang een substring in een string

De volgende code laat zien hoe u de subtekenreeks die begint op positie 1 en eindigt op positie 5 vervangt voor elke tekenreeks in de kolom ‚team‘:

 library (stringr)

#replace all characters between position 1 and 5 in 'team' column
str_sub(string=df$team, start= 1 , end= 5 ) <- 'TEAM'

#view updated data frame
df

   team conference points
1 TEAMA West 88
2 TEAMB West 97
3 TEAMC East 94
4 TEAMD East 104

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe str_replace te gebruiken in R
Hoe str_split te gebruiken in R
Hoe str_detect te gebruiken in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert