A: überprüfen sie, ob die zeichenfolge mehrere teilzeichenfolgen enthält


Sie können in R die folgenden Methoden verwenden, um zu überprüfen, ob eine Zeichenfolge mehrere Teilzeichenfolgen enthält:

Methode 1: Überprüfen Sie, ob die Zeichenfolge eine von mehreren Teilzeichenfolgen enthält

 df$contains_any <- apply(sapply(find_strings, grepl, df$team), 1 , any )

Diese spezielle Syntax prüft, ob jede Zeichenfolge in der Teamspalte eine der Zeichenfolgen enthält, die im Zeichenfolgenvektor namens find_strings angegeben sind.

Methode 2: Überprüfen Sie, ob die Zeichenfolge mehrere Teilzeichenfolgen enthält

 df$contains_any <- apply(sapply(find_strings, grepl, df$team), 1 , all )

Diese spezielle Syntax prüft, ob jede Zeichenfolge in der Teamspalte alle Zeichenfolgen enthält, die im Zeichenfolgenvektor namens find_strings angegeben sind.

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df = data. frame (team=c('Good East Team', 'Good West Team', 'Great East Team',
                       'Great West Team', 'Bad East Team', 'Bad West Team'),
                points=c(93, 99, 105, 110, 85, 88))

#view data frame
df

             team points
1 Good East Team 93
2 Good West Team 99
3 Great East Team 105
4 Great West Team 110
5 Bad East Team 85
6 Bad West Team 88

Beispiel 1: Prüfen Sie, ob die Zeichenfolge eine von mehreren Teilzeichenfolgen enthält

Mit der folgenden Syntax können wir prüfen, ob jede Zeichenfolge in der Teamspalte entweder die Teilzeichenfolge „Gut“ oder „Ist“ enthält:

 #define substrings to look for
find_strings <- c(' Good ', ' East ')

#check if each string in team column contains either substring
df$good_or_east <- apply(sapply(find_strings, grepl, df$team), 1 , any )

#view updated data frame
df

             team points good_or_east
1 Good East Team 93 TRUE
2 Good West Team 99 TRUE
3 Great East Team 105 TRUE
4 Great West Team 110 FALSE
5 Bad East Team 85 TRUE
6 Bad West Team 88 FALSE

Die neue Spalte „good_or_east“ gibt die folgenden Werte zurück:

  • TRUE , wenn das Team „Gut“ oder „Ist“ enthält.
  • FALSE , wenn das Team weder „Good“ noch „East“ enthält.

Beispiel 2 : Überprüfen Sie, ob die Zeichenfolge mehrere Teilzeichenfolgen enthält

Mit der folgenden Syntax können wir prüfen, ob jede Zeichenfolge in der Teamspalte die Teilzeichenfolgen „Good“ und „Is“ enthält:

 #define substrings to look for
find_strings <- c(' Good ', ' East ')

#check if each string in team column contains either substring
df$good_and_east <- apply(sapply(find_strings, grepl, df$team), 1 , all )

#view updated data frame
df

             team points good_and_east
1 Good East Team 93 TRUE
2 Good West Team 99 FALSE
3 Great East Team 105 FALSE
4 Great West Team 110 FALSE
5 Bad East Team 85 FALSE
6 Bad West Team 88 FALSE

Die neue Spalte good_and_east gibt die folgenden Werte zurück:

  • TRUE , wenn das Team „Gut“ und „Ist“ enthält.
  • FALSE , wenn das Team nicht „Gut“ und „Ist“ enthält.

Beachten Sie, dass nur ein WAHR- Wert zurückgegeben wird, da es nur einen Teamnamen gibt, der die Teilzeichenfolge „Gut“ und die Teilzeichenfolge „Ost“ enthält.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:

A: So überprüfen Sie, ob sich das Zeichen in einer Zeichenfolge befindet
A: So entfernen Sie Leerzeichen aus Zeichenfolgen
A: So extrahieren Sie eine Zeichenfolge zwischen bestimmten Zeichen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert