パンダ: isin() メソッドと query() メソッドを使用する方法


多くの場合、パンダのquery()メソッドでisin()関数を使用して、列にリスト内の値が含まれる DataFrame 内の行をフィルター処理することができます。

これを行うには、次の構文を使用できます。

 df. query (' team in ["A", "B", "D"] ')

この特定のクエリは、チーム列が A、B、または D に等しいパンダ データフレームの行をフィルターします。

: pandas query()メソッドを使用する場合は、 isinの代わりにin を使用する必要があります。

次の例は、この構文を実際に使用する方法を示しています。

例: query() メソッドを使用してリスト内の値をフィルタリングします。

さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
4 C 14 12 6
5 C 11 9 5
6 D 20 9 9
7 E 28 4 12

ここで、チーム列の値が A、B、または D に等しい行を検索するとします。

これを行うには、次の構文を使用できます。

 #query for rows where team is in list of specific teams
df. query (' team in ["A", "B", "D"] ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 9

query()関数は、チーム列の値が A、B、または D に等しいすべての行を返すことに注意してください。

また、チーム名のリストを変数に保存し、 @演算子を使用してquery()関数でその変数を参照できることにも注意してください。

 #create variable to hold specific team names
team_names = [" A ", " B ", " D "]

#query for rows where team is equal to a team name in team_names variable
df. query (' team in @team_names ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 92

クエリは、 team がteam_names変数に格納されているチーム名の 1 つと等しい DataFrame 内のすべての行を返します。

このクエリの結果は前の例の結果と一致することに注意してください。

: pandas query()関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas: 文字列の長さに基づいて行をフィルタリングする方法
Pandas: 条件に基づいて行を削除する方法
パンダ: 「NO IN」フィルターの使用方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です