Pandas: 値の合計を含むピボット テーブルを作成する方法


次の基本構文を使用して、特定の列の値の合計を表示するピボット テーブルをパンダで作成できます。

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ')

次の例は、この構文を実際に使用する方法を示しています。

例: 値の合計を含む Pandas ピボットテーブルを作成する

さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)


  team position points
0 AG 4
1 GA 4
2 AF 6
3AF 8
4 BG 9
5 BF 5
6 BF 5
7 BF 12

次のコードは、DataFrame 内の各「チーム」と「ポジション」の「ポイント」値の合計を表示するピボット テーブルをパンダで作成する方法を示しています。

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ')

#view pivot table
print (df_pivot)

FG position
team           
At 14 8
B 22 9

結果から次のことがわかります。

  • チーム A のポジション F の選手は合計14得点を獲得しました。
  • チームAのポジションGの選手は合計8得点を獲得した。
  • チーム B のポジション F の選手は合計22得点を獲得しました。
  • チーム B のポジション G の選手は合計9ポイントを獲得しました。

margins引数を使用して、ピボット テーブルにマージンの合計を表示することもできることに注意してください。

 #create pivot table with margins
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ', margins= True , margins_name=' Sum ')

#view pivot table
print (df_pivot)

position FG Sum
team                 
A 14 8 22
B 22 9 31
Total 36 17 53

ピボットテーブルに行と列の合計が表示されるようになりました。

: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

パンダ: DataFrame を長いものから広いものに再形成する方法
パンダ: DataFrame を幅広から長さに変更する方法
パンダ: 複数の列をグループ化して集計する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です