Verwendung von str_match in r (mit beispielen)


Die Funktion str_match() des stringr- Pakets in R kann verwendet werden, um übereinstimmende Gruppen aus einem String zu extrahieren.

Diese Funktion verwendet die folgende Syntax:

str_match(String, Muster)

Gold:

  • string: Zeichenvektor
  • Modell: Modell, nach dem gesucht werden soll

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können

Beispiel 1: Verwenden Sie str_match mit Vector

Der folgende Code zeigt, wie Sie mit der Funktion str_match() passende Muster aus einem Zeichenvektor extrahieren:

 library (stringr)

#create vector of strings
x <- c('Mavs', 'Cavs', 'Heat', 'Thunder', 'Blazers')

#extract strings that contain 'avs'
str_match(x, pattern=' avs ')

     [,1] 
[1,] “avs”
[2,] “avs”
[3,] NA   
[4,] NA   
[5,] NA  

Das Ergebnis ist eine Matrix, in der jede Zeile das passende Muster oder einen NA- Wert anzeigt, wenn das Muster nicht gefunden wurde.

Zum Beispiel:

  • Das Muster „avs“ wurde im ersten Element „Mavs“ gefunden, daher wurde „avs“ zurückgegeben.
  • Das Muster „avs“ wurde im zweiten Element „Cavs“ gefunden, daher wurde „avs“ zurückgegeben.
  • Das Muster „avs“ wurde im dritten Element „Heat“ nicht gefunden, daher wurde NA zurückgegeben.

Und so weiter.

Beispiel 2: Verwenden Sie str_match mit Data Frame

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('Mavs', 'Cavs', 'Heat', 'Thunder', 'Blazers'),
                 points=c(99, 104, 110, 103, 115))

#view data frame
df

     team points
1 Mavs 99
2 Cavs 104
3 Heat 110
4 Thunder 103
5 Blazers 115

Der folgende Code zeigt, wie Sie mit der Funktion str_match() eine neue Spalte zum Datenrahmen hinzufügen, die möglicherweise ein passendes Muster für jeden Teamnamen enthält oder nicht:

 library (stringr)

#create new column
df$match <- str_match(df$team, pattern=' avs ')

#view updated data frame
df

     team points match
1 Mavs 99 avs
2 Cavs 104 avs
3 Heat 110 <NA>
4 Thunder 103 <NA>
5 Blazers 115 <NA>

Die neue Spalte mit der Bezeichnung „match“ enthält entweder die Vorlage „avs“ oder „NA“, je nachdem, ob sich die Vorlage in der Teamspalte befindet oder nicht.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So verwenden Sie str_replace in R
So verwenden Sie str_split in R
So verwenden Sie str_detect in R
So verwenden Sie str_count in R
So verwenden Sie str_pad in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert