如何计算 r 中字符串中的单词数(附示例)


您可以使用三种方法来计算 R 中字符串中的单词数:

方法一:使用Base R

 lengths(strsplit(my_string, ' '))

方法2:使用stringi包

 library (stringi)

stri_count_words(my_string)

方法3:使用stringr包

 library (stringr)

str_count(my_string, ' \\w+ ')

这些方法中的每一个都会返回一个数值,表示名为my_string的字符串中的单词数。

以下示例展示了如何在实践中使用每种方法。

示例 1:使用基数 R 计算单词数

以下代码演示如何使用 R 基本函数lengthsstrsplit计算字符串中的单词数:

 #create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

从结果中我们可以看到字符串中有七个单词。

相关:如何使用 R 中的 strsplit() 函数拆分字符串的元素

示例 2:使用 stringi 包计算单词数

以下代码显示如何使用 R 中stringi包中的stri_count_words函数计算字符串中的单词数:

 library (stringi)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

从结果中我们可以看到字符串中有七个单词。

示例 3:使用 stringr 包计算单词数

以下代码显示如何使用 R 中stringr包中的str_count函数计算字符串中的单词数:

 library (stringr)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, ' \\w+ ')

[1] 7

从结果中我们可以看到字符串中有七个单词。

请注意,我们使用正则表达式\\w+来匹配非单词字符,其中+号表示一行中的一个或多个。

注意:在每个示例中,我们都计算了单个字符串中的单词数,但每种方法也适用于字符串向量。

其他资源

以下教程解释了如何在 R 中执行其他常见任务:

如何在R中查找字符串中的字符位置
如何从R中的字符串中删除字符
如何在 R 中选择包含特定字符串的列

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注