Pandas: 複数の aggfunc を使用してピボット テーブルを作成する
次の構文を使用して、パンダでピボット テーブルを作成し、 aggfunc引数に複数の値を指定できます。
df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))
この特定の例では、 col1によってグループ化された、 col2の値の合計と平均を表示するピボット テーブルを作成します。
次の例は、この構文を実際に使用する方法を示しています。
例: 複数の aggfunc を使用して Pandas ピボット テーブルを作成する
さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'], ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3], ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]}) #view DataFrame print (df) team points assists 0 to 4 2 1 to 4 2 2 to 2 5 3 to 8 5 4 B 9 4 5 B 5 7 6 B 5 5 7 B 7 3 8 C 8 9 9 C 8 8 10 C 4 4 11 C 3 4
次のコードを使用して、各チームが獲得したポイントの合計と平均の両方を要約するピボット テーブルを作成できます。
#create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))
mean sum
team
At 4.50 18
B 6.50 26
C 5.75 23
結果のピボット テーブルには、各チームが獲得したポイントの平均と合計が要約されます。
たとえば、次のことがわかります。
- チームA のプレーヤーの平均ポイント値は4.50 、合計ポイント値は18でした。
- チームBプレーヤーの平均ポイント値は6.50で、合計ポイント値は26でした。
- チームC のプレーヤーの平均ポイント値は5.75で、合計ポイント値は23でした。
この例では合計と平均を使用して集計しましたが、次のような他の指標によって集計することもできることに注意してください。
- カウント
- 分
- 最大
- 中央値
- std (標準偏差)
次の例は、各チームのこれらのメトリクスに基づいてポイント列の値を集計する方法を示しています。
#create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))
count max median min std
team
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956
注: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、他の一般的なパンダのタスクを実行する方法について説明します。
Pandas: 列の値でピボットテーブルを並べ替える方法
Pandas: 値の合計を含むピボット テーブルを作成する方法
パンダ: ピボット テーブルに小計を追加する方法
Pandas: ピボット テーブルの列名を変更する方法