Verwendung der substring-funktion in r (4 beispiele)


Die Funktion substring() in R kann verwendet werden, um einen Teilstring in einem Zeichenvektor zu extrahieren.

Diese Funktion verwendet die folgende Syntax:

 substring(text, first, last)

Gold:

  • text: Name des Zeichenvektors
  • first: Das erste zu extrahierende Element
  • last: Das letzte zu extrahierende Element

Beachten Sie auch, dass die Funktion substr() genau das Gleiche tut, jedoch mit leicht unterschiedlichen Argumentnamen:

 substr(text, first, last)

Gold:

  • x: Name des Zeichenvektors
  • start: Das erste zu extrahierende Element
  • stop: Das letzte zu extrahierende Element

Die Beispiele in diesem Tutorial zeigen, wie Sie die Funktion substring() in der Praxis mit dem folgenden Datenrahmen in R verwenden:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Beispiel 1: Zeichen zwischen bestimmten Positionen extrahieren

Der folgende Code zeigt, wie Sie mit der Funktion substring() Zeichen zwischen den Positionen 2 und 5 der Spalte „team“ extrahieren:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Beachten Sie, dass die neue Spalte die Zeichen zwischen den Positionen 2 und 5 der Spalte „Team“ enthält.

Beispiel 2: Extrahieren Sie die ersten N Zeichen

Der folgende Code zeigt, wie Sie mit der Funktion substring() die ersten drei Zeichen aus der Spalte „Team“ extrahieren:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Beachten Sie, dass die neue Spalte die ersten drei Zeichen der Spalte „Team“ enthält.

Beispiel 3: Extrahieren Sie die letzten N Zeichen

Der folgende Code zeigt, wie Sie mit der Funktion substring() die letzten drei Zeichen aus der Spalte „Team“ extrahieren:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Beachten Sie, dass die neue Spalte die letzten drei Zeichen der Spalte „Team“ enthält.

Beispiel 4: Ersetzen Sie einen Teilstring

Der folgende Code zeigt, wie Sie mit der Funktion substring() die ersten drei Zeichen der Werte in der Spalte „Team“ durch drei Sternchen ersetzen:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Beachten Sie, dass die ersten drei Zeichen jedes Teamnamens durch Sternchen ersetzt wurden.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Operationen mit Zeichenfolgen in R durchführen:

So verwenden Sie str_replace in R
So führen Sie einen teilweisen String-Abgleich in R durch
So konvertieren Sie Zeichenfolgen in Datumsangaben in R
So konvertieren Sie Zeichen in R in Zahlen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert