Pandas:如何检查列是否包含字符串


您可以使用以下方法来检查 pandas DataFrame 的列是否包含字符串:

方法一:检查列中是否存在确切的字符串

 (df[' col ']. eq (' exact_string ')). any ()

方法2:检查列中是否存在部分字符串

 df[' col ']. str . contains (' partial_string '). any ()

方法 3:计算列中部分字符串的出现次数

 df[' col ']. str . contains (' partial_string '). sum ()

本教程解释了如何在实践中使用以下 DataFrame 的每种方法:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

示例 1:检查列中是否存在确切的字符串

以下代码显示如何检查 DataFrame 的会议列中是否存在确切的字符串“Eas”:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

输出返回False ,这告诉我们 DataFrame 的会议列中不存在确切的字符串“Eas”。

示例 2:检查列中是否存在部分字符串

以下代码显示如何检查DataFrame 的会议中是否存在部分字符串“Eas”

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

输出返回True ,这告诉我们部分字符串“Eas”存在于 DataFrame 的会议列中。

示例 3:计算列中部分字符串的出现次数

以下代码显示了如何计算部分字符串“Eas”在DataFrame的会议列中出现的次数:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

输出返回3 ,这告诉我们部分字符串 ‘Eas’ 在 DataFrame 的会议列中出现了 3 次。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

如何根据条件删除 Pandas DataFrame 中的行
如何根据多个条件过滤 Pandas DataFrame
如何在 Pandas DataFrame 中使用“NOT IN”过滤器

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注