パンダ: ピボット テーブルに小計を追加する方法
パンダのピボット テーブルに小計を追加したい場合がよくあります。
幸いなことに、これは pandas の組み込み関数を使用して簡単に行うことができます。
次の例は、これを行う方法を示しています。
例: Pandas ピボットテーブルに小計を追加する
さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'], ' all_star ': ['Y', 'N', 'Y', 'Y', 'N', 'N', 'N', 'Y'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position all_star points 0 AGY 4 1 AGN 4 2 AFY 6 3 AFY 8 4 BGN 9 5 BFN 5 6 BFN 5 7 BFY 12
次のコードを使用して、DataFrame 内のteam 、 all_star 、 positionの各組み合わせのポイントの合計を表示するピボット テーブルをパンダで作成できます。
#create pivot table
my_table = pd. pivot_table (df, values=' points ',
index=[' team ', ' all_star '],
columns=' position ',
aggfunc=' sum ')
#view pivot table
print (my_table)
FG position
team all_star
AN NaN 4.0
Y 14.0 4.0
BN 10.0 9.0
Y 12.0 NaN
ここで、各チームとポジションの小計ポイントを表示する小計行を追加するとします。
これを行うには、次の構文を使用できます。
#add subtotals row to pivot table
p.d. concat ([
y. append ( y.sum (). rename ((x, ' Total ')))
for x, y in my_table. groupby (level= 0 )
]). append ( my_table.sum (). rename ((' Large ', ' Total ')))
position F G
team all_star
A N NaN 4.0
Y 7.0 4.0
Overall 7.0 8.0
B N 5.0 9.0
Y 12.0 NaN
Total 17.0 9.0
Grand Total 24.0 17.0
これで、各チームとポジションの小計ポイントを示す 2 つの小計行と、各列の総計を示す総計行ができました。
注: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。
Pandas: 値の数を含むピボット テーブルを作成する方法
Pandas: ピボットテーブルの NaN 値をゼロに置き換える方法
パンダ: ピボットテーブルをデータフレームに変換する方法