So extrahieren sie eine zeichenfolge vor einem leerzeichen in r
Sie können die folgenden Methoden verwenden, um eine Zeichenfolge vor einem Leerzeichen in R zu extrahieren:
Methode 1: Extrahieren Sie die Zeichenfolge vor dem Leerzeichen mithilfe der Basis R
gsub(“ .*$ ”, “”, my_string)
Methode 2: Extrahieren Sie die Zeichenfolge vor dem Leerzeichen mithilfe des Stringr-Pakets
library (stringr)
word(my_string, 1)
Beide Beispiele extrahieren die Zeichenfolge vor dem ersten Leerzeichen aus der Zeichenfolge namens my_string .
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird:
#create data frame
df <- data. frame (athlete=c('A', 'B', 'C', 'D'),
distance=c('23.2 miles', '14 miles', '5 miles', '9.3 miles'))
#view data frame
df
distance athlete
1 to 23.2 miles
2 B 14 miles
3 C 5 miles
4 D 9.3 miles
Beispiel 1: Extrahieren Sie eine Zeichenfolge vor einem Leerzeichen mit Base R
Der folgende Code zeigt, wie die Zeichenfolge vor dem Leerzeichen in jeder Zeichenfolge in der Abstandsspalte des Datenrahmens extrahiert wird:
#create new column that extracts string before space in distance column df$distance_amount <- gsub( " .*$ ", "", df$distance) #view updated data frame df athlete distance distance_amount 1 A 23.2 miles 23.2 2 B 14 miles 14 3 C 5 miles 5 4 D 9.3 miles 9.3
Beachten Sie, dass die neue Spalte mit dem Namen distance_amount die Zeichenfolge vor dem Leerzeichen in den Zeichenfolgen in der Distanzspalte des Datenrahmens enthält.
Verwandte Themen : Eine Einführung in gsub() in R
Beispiel 2: Extrahieren Sie eine Zeichenfolge vor einem Leerzeichen mit dem Stringr-Paket
Der folgende Code zeigt, wie die Zeichenfolge vor dem Leerzeichen in jeder Zeichenfolge in der Abstandsspalte des Datenrahmens mithilfe der Funktion „word()“ des Pakets „stringr“ in R extrahiert wird:
library (stringr) #create new column that extracts string before space in distance column df$distance_amount <- word(df$distance, 1) #view updated data frame df athlete distance distance_amount 1 A 23.2 miles 23.2 2 B 14 miles 14 3 C 5 miles 5 4 D 9.3 miles 9.3
Beachten Sie, dass die neue Spalte mit dem Namen distance_amount die Zeichenfolge vor dem Leerzeichen in den Zeichenfolgen in der Distanzspalte des Datenrahmens enthält.
Dies entspricht den Ergebnissen der Verwendung der Funktion gsub() in Basis R.
Beachten Sie, dass die Funktion word() des Pakets stringr Wörter aus einer bestimmten Zeichenfolge extrahiert.
Indem wir dieser Funktion den Wert 1 bereitstellen, können wir das erste in einer Zeichenfolge gefundene Wort extrahieren, was dem Extrahieren der Zeichenfolge vor dem ersten Leerzeichen entspricht.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So extrahieren Sie eine Zeichenfolge nach einem bestimmten Zeichen in R
So extrahieren Sie eine Zeichenfolge zwischen bestimmten Zeichen in R
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R