A: so überprüfen sie, ob die spalte eine zeichenfolge enthält


Mit den folgenden Methoden können Sie prüfen, ob eine Spalte eines Datenrahmens in R eine Zeichenfolge enthält:

Methode 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Methode 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Methode 3: Teilweise vorkommende Zeichenfolgen in der Spalte zählen

 sum(str_detect(df$column_name, ' partial_string '))

In diesem Tutorial wird erläutert, wie Sie die einzelnen Methoden in der Praxis mit dem folgenden Datenrahmen verwenden:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Beispiel 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist

Der folgende Code zeigt, wie überprüft wird, ob die genaue Zeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens vorhanden ist:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

Die Ausgabe gibt FALSE zurück.

Dies sagt uns, dass die genaue Zeichenfolge „Eas“ in der Spalte „conf“ nicht vorhanden ist.

Hinweis : Wir haben Regex-Symbole verwendet, um die Anfangs- ( ^ ) und Endzeichen ( $ ) der gesuchten Zeichenfolge anzuzeigen.

Beispiel 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist

Der folgende Code zeigt, wie überprüft wird, ob die Teilzeichenfolge „Eas“ in der Spalte „conf“ des Datenrahmens vorhanden ist:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

Die Ausgabe gibt TRUE zurück.

Dies sagt uns, dass die Teilzeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens vorhanden ist.

Beispiel 3: Zählen Sie das Vorkommen einer Teilzeichenfolge in einer Spalte

Der folgende Code zeigt, wie man zählt, wie oft die Teilzeichenfolge „Eas“ in der Conf- Spalte des Datenrahmens erscheint:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

Die Ausgabe gibt 3 zurück.

Dies sagt uns, dass die Teilzeichenfolge „Eas“ dreimal in der Conf- Spalte des Datenrahmens vorkommt.

Verwandt: So verwenden Sie die Funktion str_detect() in R

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:

So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge in R enthalten
So entfernen Sie Zeichen aus einer Zeichenfolge in R
So finden Sie die Zeichenposition in einer Zeichenfolge in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert