R: teilzeichenfolge vom ende der zeichenfolge extrahieren


Sie können die folgenden Methoden verwenden, um einen Teilstring in R beginnend am Ende des Strings zu extrahieren:

Methode 1: Verwenden Sie Base R

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#extract 3 characters starting from end
substr_end(my_string, 3 )

Methode 2: Verwenden Sie das stringr-Paket

 library (stringr)

#extract 3 characters starting from end 
str_sub(my_string, start = - 3 )

Diese beiden Beispiele extrahieren die letzten drei Zeichen aus der Zeichenfolge namens my_string .

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Lakers', 'Hawks', 'Nets', 'Warriors'),
                 dots=c(100, 143, 129, 113, 123))

#view data frame
df

       team points
1 Mavericks 100
2 Lakers 143
3 Hawks 129
4 Nets 113
5 Warriors 123

Beispiel 1: Extrahieren Sie einen Teilstring vom Ende mithilfe von Base R

Der folgende Code zeigt, wie man eine benutzerdefinierte Funktion in Basis-R definiert und dann die Funktion verwendet, um die letzten drei Zeichen aus jeder Zeichenfolge in der Teamspalte zu extrahieren:

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#create new column that extracts last 3 characters from team column
df$team_last3 <- substr_end(my_string, 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

Beachten Sie, dass die neue Spalte namens team_last3 die letzten drei Zeichen jeder Zeichenfolge in der Teamspalte des Datenrahmens enthält.

Beispiel 2: Extrahieren Sie einen Teilstring vom Ende mit dem Stringr-Paket

Der folgende Code zeigt, wie Sie die Funktion str_sub() aus dem Paket stringr in R verwenden, um die letzten drei Zeichen aus jeder Zeichenfolge in der Teamspalte zu extrahieren:

 library (stringr)

#create new column that extracts last 3 characters from team column
df$team_last3 <- str_sub(df$team, start = - 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

Beachten Sie, dass die neue Spalte namens team_last3 die letzten drei Zeichen jeder Zeichenfolge in der Teamspalte des Datenrahmens enthält.

Dies entspricht den Ergebnissen der vorherigen Methode auf R-Basis.

Verwandte Themen : Eine Einführung in die Funktion str_sub in R

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert