So zählen sie wörter in einer zeichenfolge in r (mit beispielen)
Es gibt drei Methoden, mit denen Sie die Anzahl der Wörter in einer Zeichenfolge in R zählen können:
Methode 1: Verwenden Sie Base R
lengths(strsplit(my_string, ' '))
Methode 2: Verwenden Sie das Stringi-Paket
library (stringi)
stri_count_words(my_string)
Methode 3: Verwenden Sie das stringr-Paket
library (stringr) str_count(my_string, ' \\w+ ')
Jede dieser Methoden gibt einen numerischen Wert zurück, der die Anzahl der Wörter in der Zeichenfolge namens my_string darstellt.
Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis angewendet werden kann.
Beispiel 1: Zählen Sie Wörter mit der Basis R
Der folgende Code zeigt, wie die Anzahl der Wörter in einer Zeichenfolge mithilfe der R-Basisfunktionen lengths und strsplit gezählt wird:
#create string my_string <- 'this is a string with seven words' #count number of words in string lengths(strsplit(my_string, ' ')) [1] 7
Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.
Verwandt: So verwenden Sie die Funktion strsplit() in R, um Elemente einer Zeichenfolge zu teilen
Beispiel 2: Wörter zählen mit dem Stringi-Paket
Der folgende Code zeigt, wie man die Anzahl der Wörter in einem String mit der Funktion stri_count_words aus dem Paket stringi in R zählt:
library (stringi) #create string my_string <- 'this is a string with seven words' #count number of words in string stri_count_words(my_string) [1] 7
Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.
Beispiel 3: Wörter zählen mit dem stringr-Paket
Der folgende Code zeigt, wie die Anzahl der Wörter in einer Zeichenfolge mithilfe der Funktion str_count aus dem Paket stringr in R gezählt wird:
library (stringr) #create string my_string <- 'this is a string with seven words' #count number of words in string str_count(my_string, ' \\w+ ') [1] 7
Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.
Beachten Sie, dass wir den regulären Ausdruck \\w+ verwendet haben, um Nicht-Wort-Zeichen mit dem + -Zeichen abzugleichen, um ein oder mehrere Zeichen in einer Zeile anzuzeigen.
Hinweis : In jedem dieser Beispiele haben wir die Anzahl der Wörter in einer einzelnen Zeichenfolge gezählt, aber jede Methode funktioniert auch mit einem Vektor aus Zeichenfolgen.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So finden Sie die Zeichenposition in einer Zeichenfolge in R
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten