A: so überprüfen sie, ob die spalte eine zeichenfolge enthält
Mit den folgenden Methoden können Sie prüfen, ob eine Spalte eines Datenrahmens in R eine Zeichenfolge enthält:
Methode 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist
sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0
Methode 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist
sum(str_detect(df$column_name, ' partial_string ')) > 0
Methode 3: Teilweise vorkommende Zeichenfolgen in der Spalte zählen
sum(str_detect(df$column_name, ' partial_string '))
In diesem Tutorial wird erläutert, wie Sie die einzelnen Methoden in der Praxis mit dem folgenden Datenrahmen verwenden:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
dots=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19
Beispiel 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist
Der folgende Code zeigt, wie überprüft wird, ob die genaue Zeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens vorhanden ist:
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, ' ^Eas$ ')) > 0 [1] FALSE
Die Ausgabe gibt FALSE zurück.
Dies sagt uns, dass die genaue Zeichenfolge „Eas“ in der Spalte „conf“ nicht vorhanden ist.
Hinweis : Wir haben Regex-Symbole verwendet, um die Anfangs- ( ^ ) und Endzeichen ( $ ) der gesuchten Zeichenfolge anzuzeigen.
Beispiel 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist
Der folgende Code zeigt, wie überprüft wird, ob die Teilzeichenfolge „Eas“ in der Spalte „conf“ des Datenrahmens vorhanden ist:
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, ' Eas ')) > 0 [1] TRUE
Die Ausgabe gibt TRUE zurück.
Dies sagt uns, dass die Teilzeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens vorhanden ist.
Beispiel 3: Zählen Sie das Vorkommen einer Teilzeichenfolge in einer Spalte
Der folgende Code zeigt, wie man zählt, wie oft die Teilzeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens erscheint:
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, ' Eas ')) [1] 3
Die Ausgabe gibt 3 zurück.
Dies sagt uns, dass die Teilzeichenfolge „Eas“ dreimal in der Conf- Spalte des Datenrahmens vorkommt.
Verwandt: So verwenden Sie die Funktion str_detect() in R
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R