パンダ:列に値が存在するかどうかを確認する方法


次のメソッドを使用して、pandas DataFrame の列に特定の値が存在するかどうかを確認できます。

方法 1: 列に値があるかどうかを確認する

 22 in df[' my_column ']. values

方法 2: 列に複数の値のいずれかが存在するかどうかを確認する

 df[' my_column ']. isin ([44, 45, 22]). any ()

次の例は、次の DataFrame で各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

例 1: 列に値があるかどうかを確認する

次のコードは、ポイント列に値22 が存在するかどうかを確認する方法を示しています。

 #check if 22 exists in the 'points' column
22 in df[' points ']. values

True

出力はTrueを返します。これは、値22Points列に存在することを示します。

文字列列にも同じ構文を使用できます。

たとえば、次のコードは、文字列「J」がチーム列に存在するかどうかを確認する方法を示しています。

 #check if 'J' exists in the 'team' column
'J' in df[' team ']. values

False

出力はFalseを返します。これは、文字列「J」がTeam列に存在しないことを示します。

例 2: 列に複数の値のいずれかが存在するかどうかを確認する

次のコードは、リスト [44、45、22] のいずれかの値がポイント列に存在するかどうかを確認する方法を示しています。

 #check if 44, 45 or 22 exist in the 'points' column
df[' points ']. isin ([44, 45, 22]). any ()

True

出力はTrueを返します。これは、リスト [44, 45, 22] の値の少なくとも 1 つが DataFrame のポイント列に存在することを示します。

文字列列にも同じ構文を使用できます。

たとえば、次のコードは、リスト [‘J’, ‘K’, ‘L’] の文字列がチーム列に存在するかどうかを確認する方法を示しています。

 #check if J, K, or L exists in the 'team' column
df[' team ']. isin ([' J ',' K ',' L ']). any () 
False

出力はFalseを返します。これは、リスト内の文字列がチーム列に存在しないことを示します。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

条件に基づいて Pandas DataFrame の行を削除する方法
複数の条件で Pandas DataFrame をフィルタリングする方法
Pandas DataFrame で「NOT IN」フィルターを使用する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です