Pandas:如何检查列是否包含字符串
您可以使用以下方法来检查 pandas DataFrame 的列是否包含字符串:
方法一:检查列中是否存在确切的字符串
(df[' col ']. eq (' exact_string ')). any ()
方法2:检查列中是否存在部分字符串
df[' col ']. str . contains (' partial_string '). any ()
方法 3:计算列中部分字符串的出现次数
df[' col ']. str . contains (' partial_string '). sum ()
本教程解释了如何在实践中使用以下 DataFrame 的每种方法:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
示例 1:检查列中是否存在确切的字符串
以下代码显示如何检查 DataFrame 的会议列中是否存在确切的字符串“Eas”:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
输出返回False ,这告诉我们 DataFrame 的会议列中不存在确切的字符串“Eas”。
示例 2:检查列中是否存在部分字符串
以下代码显示如何检查DataFrame 的会议列中是否存在部分字符串“Eas” :
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
输出返回True ,这告诉我们部分字符串“Eas”存在于 DataFrame 的会议列中。
示例 3:计算列中部分字符串的出现次数
以下代码显示了如何计算部分字符串“Eas”在DataFrame的会议列中出现的次数:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
输出返回3 ,这告诉我们部分字符串 ‘Eas’ 在 DataFrame 的会议列中出现了 3 次。
其他资源
以下教程解释了如何在 pandas 中执行其他常见操作:
如何根据条件删除 Pandas DataFrame 中的行
如何根据多个条件过滤 Pandas DataFrame
如何在 Pandas DataFrame 中使用“NOT IN”过滤器