パンダ: 列に文字列が含まれているかどうかを確認する方法


次のメソッドを使用して、pandas DataFrame の列に文字列が含まれているかどうかを確認できます。

方法 1: 正確な文字列が列に存在するかどうかを確認する

 (df[' col ']. eq (' exact_string ')). any ()

方法 2: 部分文字列が列に存在するかどうかを確認する

 df[' col ']. str . contains (' partial_string '). any ()

方法 3:列内の部分文字列の出現をカウントする

 df[' col ']. str . contains (' partial_string '). sum ()

このチュートリアルでは、次の DataFrame で各メソッドを実際に使用する方法を説明します。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

例 1: 列に正確な文字列が存在するかどうかを確認する

次のコードは、DataFrame の会議列に正確な文字列「Eas」が存在するかどうかを確認する方法を示しています。

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

出力はFalseを返します。これは、正確な文字列「Eas」が DataFrame の会議列に存在しないことを示します。

例 2: 部分文字列が列に存在するかどうかを確認する

次のコードは、部分文字列「Eas」がDataFrame の会議列に存在するかどうかを確認する方法を示しています。

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

出力はTrueを返します。これは、部分文字列「Eas」が DataFrame の会議列に存在することを示します。

例 3: 列内の部分文字列の出現数をカウントする

次のコードは、部分文字列「Eas」が DataFrame の会議列に出現する回数をカウントする方法を示しています。

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

出力は3を返します。これは、部分文字列 ‘Eas’ が DataFrame の会議列に 3 回出現することを示します。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

条件に基づいて Pandas DataFrame の行を削除する方法
複数の条件で Pandas DataFrame をフィルタリングする方法
Pandas DataFrame で「NOT IN」フィルターを使用する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です