Pandas loc を使用して複数の条件に基づいて行を選択する方法


次のメソッドを使用して、いくつかの条件に基づいて pandas DataFrame から行を選択できます。

方法 1: 複数の条件を満たす行を選択する

 df. loc [((df[' col1 '] == ' A ') & (df[' col2' ] == ' G '))]

方法 2: いくつかの条件のいずれかを満たす行を選択する

 df. loc [((df[' col1 '] > 10) | (df[' col2' ] < 8))]

次の例は、次の pandas DataFrame でこれらの各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team position assists rebounds
0 A G 5 11
1 A G 7 8
2 A F 7 10
3 A F 9 6
4 B G 12 6
5 B G 9 5
6 B F 9 9
7 B F 4 12

方法 1: 複数の条件を満たす行を選択する

次のコードは、データフレームから、チームが「A」、ポジションが「G」に等しい行のみを選択する方法を示しています。

 #select rows where team is equal to 'A' and position is equal to 'G'
df. loc [((df[' team '] == ' A ') & (df[' position '] == ' G '))]

	team position assists rebounds
0 A G 5 11
1 A G 7 8

これらの条件の両方を満たすデータフレーム内の行は 2 行だけでした。

方法 2: いくつかの条件のいずれかを満たす行を選択する

次のコードは、アシストが 10 より大きいか、リバウンドが 8 より小さい DataFrame 内の行のみを選択する方法を示しています。

 #select rows where assists is greater than 10 or rebounds is less than 8
df. loc [((df[' assists '] > 10) | (df[' rebounds '] < 8))]

	team position assists rebounds
3 A F 9 6
4 B G 12 6
5 B G 9 5

これらの条件を両方とも満たすデータフレーム行は 3 行だけでした。

注:これら 2 つの例では、2 つの条件に基づいて行をフィルターしましたが、& と| を使用しました。属性。演算子を使用すると、必要な数の条件でフィルタリングできます。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

Pandas で条件に基づいて新しい列を作成する方法
Pandasで特定の値を含む行を削除する方法
Pandas で重複した行を削除する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です