A:如何使用带有多个分隔符的 strsplit()


您可以将以下基本语法与 R 中的strsplit()函数结合使用,根据多个分隔符将字符串拆分为多个片段:

 strsplit(my_string, ' [,& ]+ ')

此特定示例每当遇到以下三个分隔符之一时就会分割名为my_string的字符串:

  • 一个逗号 ( , )
  • 与号 ( & )
  • 一个地区

请注意,括号中的字符表示要搜索哪些分隔符, +号表示一行中可能有多个分隔符(例如一行中可能有多个空格)。

以下示例展示了如何在实践中使用此语法。

示例:在 R 中使用带有多个分隔符的 strsplit()

假设我们在 R 中有以下字符串:

 #create string
my_string <- 'this is a, string & with seven words'

如果我们使用strsplit()函数在每次遇到空格时分割字符串,则会产生以下结果:

 #split string based on spaces
strsplit(my_string, ' ')

[[1]]
 [1] "this" "is" "a," "string" "&" "with" "" ""      
 [9] “seven” “words”

strsplit()函数会在遇到空格时分割字符串,但它无法处理逗号、& 符号和多个空格。

要根据每个分隔符分割字符串,我们可以使用以下语法:

 #split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')

[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words" 

该函数能够根据三个不同的分隔符分割字符串,并仅正确返回字符串中我们感兴趣的单词。

请注意,在此示例中,我们在strsplit()函数中包含了三个括号分隔符,但您可以根据需要指定任意多个分隔符。

其他资源

以下教程解释了如何使用 dplyr 执行其他常见操作:

如何使用R中的strsplit()函数分割字符串元素
如何拆分字符串并获取R中的第一个元素
如何计算R中字符串中的单词数

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注