A:如何检查列中是否包含字符串


您可以使用以下方法来检查 R 中数据框的列是否包含字符串:

方法一:检查列中是否存在确切的字符串

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

方法2:检查列中是否存在部分字符串

 sum(str_detect(df$column_name, ' partial_string ')) > 0

方法 3:计算列中部分字符串的出现次数

 sum(str_detect(df$column_name, ' partial_string '))

本教程通过以下数据框解释了如何在实践中使用每种方法:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

示例 1:检查列中是否存在确切的字符串

以下代码显示如何检查数据框的conf列中是否存在确切的字符串“Eas”:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

输出返回FALSE

这告诉我们conf列中不存在确切的字符串“Eas”。

注意:我们使用正则表达式符号来指示我们要查找的字符串的开头 ( ^ ) 和结尾 ( $ ) 字符。

示例 2:检查列中是否存在部分字符串

以下代码显示如何检查数据框的conf中是否存在部分字符串“Eas”

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

输出返回TRUE

这告诉我们部分字符串“Eas”存在于数据框的conf列中。

示例 3:计算列中部分字符串的出现次数

以下代码显示如何计算部分字符串“Eas”出现在数据框的conf列中的次数:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

输出返回3

这告诉我们,部分字符串“Eas”在数据框的conf列中出现了 3 次。

相关:如何在 R 中使用 str_detect() 函数

其他资源

以下教程解释了如何在 R 中执行其他常见任务:

如何在 R 中选择包含特定字符串的列
如何从R中的字符串中删除字符
如何在R中查找字符串中的字符位置

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注