Hoe het eerste teken uit tekenreeksen te verwijderen met dplyr


U kunt de volgende basissyntaxis in dplyr gebruiken om het eerste teken uit elke tekenreeks in een bepaalde kolom te verwijderen:

 library (dplyr)

df_new <- df %>% mutate(across(c(' my_column '), substr, 2 , nchar(my_column)))

Deze specifieke syntaxis verwijdert het eerste teken van elke tekenreeks uit de kolom genaamd my_column .

Merk op dat we de functie substr() gebruiken om de subtekenreeks uit het tweede teken van elke tekenreeks te extraheren tot aan de lengte van de tekenreeks.

Dit heeft tot gevolg dat het eerste teken uit de string wordt verwijderd.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: verwijder het eerste teken uit tekenreeksen met dplyr

Stel dat we het volgende dataframe in R hebben:

 #create data frame
df <- data. frame (team=c('XMavs', 'XPacers', 'XHawks', 'XKings', 'XNets', 'XCeltics'),
                 points=c(104, 110, 134, 125, 114, 124))

#view data frame
df

      team points
1 XMavs 104
2 XPacers 110
3XHawks 134
4 XKings 125
5 XNets 114
6 XCeltics 124

Stel dat we het eerste teken uit elke tekenreeks in de teamkolom willen verwijderen.

We kunnen hiervoor de volgende syntaxis gebruiken:

 library (dplyr)

#remove first character from each string in 'team' column
df_new <- df %>% mutate(across(c(' team '), substr, 2 , nchar(team)))

#view updated data frame
df_new

     team points
1 Mavs 104
2 Pacers 110
3 Hawks 134
4 Kings 125
5 Nets 114
6 Celtics 124

Houd er rekening mee dat het eerste teken van elke tekenreeks in de teamkolom is verwijderd.

Merk op dat de functie nchar() wordt gebruikt om het totale aantal tekens in een string te berekenen.

We gebruiken dus de functie substr() om de subtekenreeks te extraheren van het tweede teken tot het laatste teken van elke tekenreeks, wat overeenkomt met het verwijderen van het eerste teken van elke tekenreeks.

Opmerking : als u het eerste teken uit meerdere kolomreeksen wilt verwijderen, neemt u eenvoudigweg meerdere kolomnamen op in de across() functie.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in dplyr uitvoert:

Rijen verwijderen met dplyr
Kolommen selecteren op index met behulp van dplyr
Hoe u rijen kunt filteren die een bepaalde tekenreeks bevatten met behulp van dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert