パンダ: ピボット テーブルにフィルターを追加する方法
次の基本構文を使用して、パンダのピボット テーブルにフィルター条件を追加できます。
df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')
この特定の例では、 col1 ごとにグループ化された、 col2とcol3の値の合計を表示するピボット テーブルを作成します。
pivot_table()関数の前のフィルターは、元の DataFrame のcol1の値が値「A」を持つ行のみを含めることを指定します。
次の例は、この構文を実際に使用する方法を示しています。
例: Pandas ピボット テーブルにフィルターを追加する方法
さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'], ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3], ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]}) #view DataFrame print (df) team points assists 0 to 4 2 1 to 4 2 2 to 2 5 3 to 8 5 4 B 9 4 5 B 5 7 6 B 5 5 7 B 7 3 8 C 8 9 9 C 8 8 10 C 4 4 11 C 3 4
次のコードを使用して、元の DataFrame のスコア列に値がある行のみ、チームごとにグループ化されたポイントとアシスト列の値の合計を表示するピボット テーブルをパンダで作成できます。 「A」に等しいチーム:
#create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
aggfunc=' sum ')
assist points
team
At 14 18
ピボット テーブルでは、チームが「A」に等しい行のポイントとアシスト列の値のみが要約されることに注意してください。
演算子&および|も使用できます。 「AND」または「OR」ロジックを使用するフィルターを適用します。
たとえば、次の構文を使用して、元のデータフレームのチーム列の値が「A」または「B」に等しい行をフィルターするピボット テーブルを作成できます。
#create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
values=[' points ', ' assists '],
aggfunc=' sum ')
assist points
team
At 14 18
B 19 26
ピボット テーブルでは、チームが「A」または「B」に等しい行のポイント列とアシスト列の値のみが要約されることに注意してください。
注: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。
Pandas: 列の値でピボットテーブルを並べ替える方法
Pandas: 値の合計を含むピボット テーブルを作成する方法
パンダ: ピボット テーブルに小計を追加する方法
Pandas: ピボット テーブルの列名を変更する方法