So extrahieren sie eine zeichenfolge nach einem bestimmten zeichen in r


Sie können die folgenden Methoden verwenden, um eine Zeichenfolge nach einem bestimmten Zeichen in R zu extrahieren:

Methode 1: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit Base R

 sub(' .*the ', '', my_string)

Methode 2: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit stringr

 library (stringr)

str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')

Beide Beispiele extrahieren die Zeichenfolge nach dem „the“-Muster in my_string .

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
                 dots=c(114, 135, 119, 140))

#view data frame
df

        team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140

Beispiel 1: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit Base R

Der folgende Code zeigt, wie die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte des Datenrahmens extrahiert wird:

 #create new column that extracts string after "the" in team column
df$team_name <- sub(' .*the ', '', df$team)

#view updated data frame
df

        team points team_name
1 theMavs 114 Mavs
2 theHeat 135 Heat
3 theNets 119 Nets
4 theRockets 140 Rockets

Beachten Sie, dass die neue Spalte namens team_name die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte im Datenrahmen enthält.

Verwandte Themen : Eine Einführung in sub() in R

Beispiel 2: Extrahieren Sie eine Zeichenfolge nach bestimmten Zeichen mit dem Paket stringr

Der folgende Code zeigt, wie die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte des Datenrahmens mithilfe der Funktion str_replace() aus dem stringr- Paket in R extrahiert wird:

 library (stringr)

#create new column that extracts string after "the" in team column
df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ')

#view updated data frame
df

           team points team_name
1 Mavs pro team 114 Mavs
2 team Heat pro 135 Heat
3 Nets pro team 119 Nets

Beachten Sie, dass die neue Spalte namens team_name die Zeichenfolge nach „the“ für jede Zeile in der Teamspalte im Datenrahmen enthält.

Dies entspricht den Ergebnissen der Verwendung der Funktion sub() in Basis R.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert