So zählen sie wörter in einer zeichenfolge in r (mit beispielen)


Es gibt drei Methoden, mit denen Sie die Anzahl der Wörter in einer Zeichenfolge in R zählen können:

Methode 1: Verwenden Sie Base R

 lengths(strsplit(my_string, ' '))

Methode 2: Verwenden Sie das Stringi-Paket

 library (stringi)

stri_count_words(my_string)

Methode 3: Verwenden Sie das stringr-Paket

 library (stringr)

str_count(my_string, ' \\w+ ')

Jede dieser Methoden gibt einen numerischen Wert zurück, der die Anzahl der Wörter in der Zeichenfolge namens my_string darstellt.

Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis angewendet werden kann.

Beispiel 1: Zählen Sie Wörter mit der Basis R

Der folgende Code zeigt, wie die Anzahl der Wörter in einer Zeichenfolge mithilfe der R-Basisfunktionen lengths und strsplit gezählt wird:

 #create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.

Verwandt: So verwenden Sie die Funktion strsplit() in R, um Elemente einer Zeichenfolge zu teilen

Beispiel 2: Wörter zählen mit dem Stringi-Paket

Der folgende Code zeigt, wie man die Anzahl der Wörter in einem String mit der Funktion stri_count_words aus dem Paket stringi in R zählt:

 library (stringi)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.

Beispiel 3: Wörter zählen mit dem stringr-Paket

Der folgende Code zeigt, wie die Anzahl der Wörter in einer Zeichenfolge mithilfe der Funktion str_count aus dem Paket stringr in R gezählt wird:

 library (stringr)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, ' \\w+ ')

[1] 7

Aus dem Ergebnis können wir erkennen, dass die Zeichenfolge sieben Wörter enthält.

Beachten Sie, dass wir den regulären Ausdruck \\w+ verwendet haben, um Nicht-Wort-Zeichen mit dem + -Zeichen abzugleichen, um ein oder mehrere Zeichen in einer Zeile anzuzeigen.

Hinweis : In jedem dieser Beispiele haben wir die Anzahl der Wörter in einer einzelnen Zeichenfolge gezählt, aber jede Methode funktioniert auch mit einem Vektor aus Zeichenfolgen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So finden Sie die Zeichenposition in einer Zeichenfolge in R
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert