パンダ: 列に文字列が含まれているかどうかを確認する方法
次のメソッドを使用して、pandas DataFrame の列に文字列が含まれているかどうかを確認できます。
方法 1: 正確な文字列が列に存在するかどうかを確認する
(df[' col ']. eq (' exact_string ')). any ()
方法 2: 部分文字列が列に存在するかどうかを確認する
df[' col ']. str . contains (' partial_string '). any ()
方法 3:列内の部分文字列の出現をカウントする
df[' col ']. str . contains (' partial_string '). sum ()
このチュートリアルでは、次の DataFrame で各メソッドを実際に使用する方法を説明します。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
例 1: 列に正確な文字列が存在するかどうかを確認する
次のコードは、DataFrame の会議列に正確な文字列「Eas」が存在するかどうかを確認する方法を示しています。
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
出力はFalseを返します。これは、正確な文字列「Eas」が DataFrame の会議列に存在しないことを示します。
例 2: 部分文字列が列に存在するかどうかを確認する
次のコードは、部分文字列「Eas」がDataFrame の会議列に存在するかどうかを確認する方法を示しています。
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
出力はTrueを返します。これは、部分文字列「Eas」が DataFrame の会議列に存在することを示します。
例 3: 列内の部分文字列の出現数をカウントする
次のコードは、部分文字列「Eas」が DataFrame の会議列に出現する回数をカウントする方法を示しています。
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
出力は3を返します。これは、部分文字列 ‘Eas’ が DataFrame の会議列に 3 回出現することを示します。
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。
条件に基づいて Pandas DataFrame の行を削除する方法
複数の条件で Pandas DataFrame をフィルタリングする方法
Pandas DataFrame で「NOT IN」フィルターを使用する方法