So entfernen sie das erste zeichen aus zeichenfolgen mit dplyr


Sie können die folgende grundlegende Syntax in dplyr verwenden, um das erste Zeichen aus jeder Zeichenfolge in einer bestimmten Spalte zu entfernen:

 library (dplyr)

df_new <- df %>% mutate(across(c(' my_column '), substr, 2 , nchar(my_column)))

Diese spezielle Syntax entfernt das erste Zeichen jeder Zeichenfolge aus der Spalte namens my_column .

Beachten Sie, dass wir die Funktion substr() verwenden, um den Teilstring vom zweiten Zeichen jedes Strings bis zur Länge des Strings zu extrahieren.

Dadurch wird das erste Zeichen aus der Zeichenfolge entfernt.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Entfernen Sie das erste Zeichen aus Zeichenfolgen mit dplyr

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('XMavs', 'XPacers', 'XHawks', 'XKings', 'XNets', 'XCeltics'),
                 points=c(104, 110, 134, 125, 114, 124))

#view data frame
df

      team points
1 XMavs 104
2 XPacers 110
3XHawks 134
4 XKings 125
5 XNets 114
6 XCeltics 124

Nehmen wir an, wir möchten das erste Zeichen aus jeder Zeichenfolge in der Teamspalte entfernen.

Wir können dazu die folgende Syntax verwenden:

 library (dplyr)

#remove first character from each string in 'team' column
df_new <- df %>% mutate(across(c(' team '), substr, 2 , nchar(team)))

#view updated data frame
df_new

     team points
1 Mavs 104
2 Pacers 110
3 Hawks 134
4 Kings 125
5 Nets 114
6 Celtics 124

Beachten Sie, dass das erste Zeichen jeder Zeichenfolge in der Teamspalte entfernt wurde.

Beachten Sie, dass die Funktion nchar() zum Berechnen der Gesamtzahl der Zeichen in einer Zeichenfolge verwendet wird.

Daher verwenden wir die Funktion substr() , um die Teilzeichenfolge vom zweiten bis zum letzten Zeichen jeder Zeichenfolge zu extrahieren, was dem Entfernen des ersten Zeichens jeder Zeichenfolge entspricht.

Hinweis : Wenn Sie das erste Zeichen aus mehreren Spaltenzeichenfolgen entfernen möchten, fügen Sie einfach mehrere Spaltennamen in die Funktion across() ein.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in dplyr ausführen:

So löschen Sie Zeilen mit dplyr
So wählen Sie Spalten nach Index mit dplyr aus
So filtern Sie Zeilen, die eine bestimmte Zeichenfolge enthalten, mit dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert