So extrahieren sie eine zeichenfolge nach einem bestimmten zeichen in r
Sie können die folgenden Methoden verwenden, um eine Zeichenfolge nach einem bestimmten Zeichen in R zu extrahieren:
Methode 1: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit Base R
sub(' .*the ', '', my_string)
Methode 2: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit stringr
library (stringr) str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')
Beide Beispiele extrahieren die Zeichenfolge nach dem „the“-Muster in my_string .
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird:
#create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
dots=c(114, 135, 119, 140))
#view data frame
df
team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140
Beispiel 1: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit Base R
Der folgende Code zeigt, wie die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte des Datenrahmens extrahiert wird:
#create new column that extracts string after "the" in team column df$team_name <- sub(' .*the ', '', df$team) #view updated data frame df team points team_name 1 theMavs 114 Mavs 2 theHeat 135 Heat 3 theNets 119 Nets 4 theRockets 140 Rockets
Beachten Sie, dass die neue Spalte namens team_name die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte im Datenrahmen enthält.
Verwandte Themen : Eine Einführung in sub() in R
Beispiel 2: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit dem Paket stringr
Der folgende Code zeigt, wie die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte des Datenrahmens mithilfe der Funktion str_replace() aus dem stringr- Paket in R extrahiert wird:
library (stringr) #create new column that extracts string after "the" in team column df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ') #view updated data frame df team points team_name 1 Mavs pro team 114 Mavs 2 team Heat pro 135 Heat 3 Nets pro team 119 Nets
Beachten Sie, dass die neue Spalte namens team_name die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte im Datenrahmen enthält.
Dies entspricht den Ergebnissen der Verwendung der Funktion sub() in Basis R.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R