A:如何使用带有多个分隔符的 strsplit()
您可以将以下基本语法与 R 中的strsplit()函数结合使用,根据多个分隔符将字符串拆分为多个片段:
strsplit(my_string, ' [,& ]+ ')
此特定示例每当遇到以下三个分隔符之一时就会分割名为my_string的字符串:
- 一个逗号 ( , )
- 与号 ( & )
- 一个地区
请注意,括号中的字符表示要搜索哪些分隔符, +号表示一行中可能有多个分隔符(例如一行中可能有多个空格)。
以下示例展示了如何在实践中使用此语法。
示例:在 R 中使用带有多个分隔符的 strsplit()
假设我们在 R 中有以下字符串:
#create string
my_string <- 'this is a, string & with seven words'
如果我们使用strsplit()函数在每次遇到空格时分割字符串,则会产生以下结果:
#split string based on spaces
strsplit(my_string, ' ')
[[1]]
[1] "this" "is" "a," "string" "&" "with" "" ""
[9] “seven” “words”
strsplit()函数会在遇到空格时分割字符串,但它无法处理逗号、& 符号和多个空格。
要根据每个分隔符分割字符串,我们可以使用以下语法:
#split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')
[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words"
该函数能够根据三个不同的分隔符分割字符串,并仅正确返回字符串中我们感兴趣的单词。
请注意,在此示例中,我们在strsplit()函数中包含了三个括号分隔符,但您可以根据需要指定任意多个分隔符。
其他资源
以下教程解释了如何使用 dplyr 执行其他常见操作: