A: überprüfen sie, ob die zeichenfolge mehrere teilzeichenfolgen enthält
Sie können in R die folgenden Methoden verwenden, um zu überprüfen, ob eine Zeichenfolge mehrere Teilzeichenfolgen enthält:
Methode 1: Überprüfen Sie, ob die Zeichenfolge eine von mehreren Teilzeichenfolgen enthält
df$contains_any <- apply(sapply(find_strings, grepl, df$team), 1 , any )
Diese spezielle Syntax prüft, ob jede Zeichenfolge in der Teamspalte eine der Zeichenfolgen enthält, die im Zeichenfolgenvektor namens find_strings angegeben sind.
Methode 2: Überprüfen Sie, ob die Zeichenfolge mehrere Teilzeichenfolgen enthält
df$contains_any <- apply(sapply(find_strings, grepl, df$team), 1 , all )
Diese spezielle Syntax prüft, ob jede Zeichenfolge in der Teamspalte alle Zeichenfolgen enthält, die im Zeichenfolgenvektor namens find_strings angegeben sind.
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:
#create data frame
df = data. frame (team=c('Good East Team', 'Good West Team', 'Great East Team',
'Great West Team', 'Bad East Team', 'Bad West Team'),
points=c(93, 99, 105, 110, 85, 88))
#view data frame
df
team points
1 Good East Team 93
2 Good West Team 99
3 Great East Team 105
4 Great West Team 110
5 Bad East Team 85
6 Bad West Team 88
Beispiel 1: Prüfen Sie, ob die Zeichenfolge eine von mehreren Teilzeichenfolgen enthält
Mit der folgenden Syntax können wir prüfen, ob jede Zeichenfolge in der Teamspalte entweder die Teilzeichenfolge „Gut“ oder „Ist“ enthält:
#define substrings to look for
find_strings <- c(' Good ', ' East ')
#check if each string in team column contains either substring
df$good_or_east <- apply(sapply(find_strings, grepl, df$team), 1 , any )
#view updated data frame
df
team points good_or_east
1 Good East Team 93 TRUE
2 Good West Team 99 TRUE
3 Great East Team 105 TRUE
4 Great West Team 110 FALSE
5 Bad East Team 85 TRUE
6 Bad West Team 88 FALSE
Die neue Spalte „good_or_east“ gibt die folgenden Werte zurück:
- TRUE , wenn das Team „Gut“ oder „Ist“ enthält.
- FALSE , wenn das Team weder „Good“ noch „East“ enthält.
Beispiel 2 : Überprüfen Sie, ob die Zeichenfolge mehrere Teilzeichenfolgen enthält
Mit der folgenden Syntax können wir prüfen, ob jede Zeichenfolge in der Teamspalte die Teilzeichenfolgen „Good“ und „Is“ enthält:
#define substrings to look for
find_strings <- c(' Good ', ' East ')
#check if each string in team column contains either substring
df$good_and_east <- apply(sapply(find_strings, grepl, df$team), 1 , all )
#view updated data frame
df
team points good_and_east
1 Good East Team 93 TRUE
2 Good West Team 99 FALSE
3 Great East Team 105 FALSE
4 Great West Team 110 FALSE
5 Bad East Team 85 FALSE
6 Bad West Team 88 FALSE
Die neue Spalte good_and_east gibt die folgenden Werte zurück:
- TRUE , wenn das Team „Gut“ und „Ist“ enthält.
- FALSE , wenn das Team nicht „Gut“ und „Ist“ enthält.
Beachten Sie, dass nur ein WAHR- Wert zurückgegeben wird, da es nur einen Teamnamen gibt, der die Teilzeichenfolge „Gut“ und die Teilzeichenfolge „Ost“ enthält.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
A: So überprüfen Sie, ob sich das Zeichen in einer Zeichenfolge befindet
A: So entfernen Sie Leerzeichen aus Zeichenfolgen
A: So extrahieren Sie eine Zeichenfolge zwischen bestimmten Zeichen