Pandas: 値の数を含むピボット テーブルを作成する方法
次のいずれかの方法を使用して、特定の列の値の数を表示するピボット テーブルをパンダで作成できます。
方法 1: 数値を使用したピボット テーブル
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' count ')
方法 2: 一意の番号を含むピボットテーブル
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=pd. Series . nunique )
次の例は、次の pandas DataFrame で各メソッドを使用する方法を示しています。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame df team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B G 9 5 B F 5 6 B F 5 7 B F 12
方法 1: カウントを含む Pandas ピボットテーブルを作成する
次のコードは、DataFrame 内の各「チーム」と「ポジション」の「ポイント」値の合計数を表示するピボット テーブルをパンダで作成する方法を示しています。
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=' count ')
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 2.0
B NaN 3.0 1.0
結果から次のことがわかります。
- チーム A のポジション C の「ポイント」列には1 つの値があります。
- チーム A のポジション F の「ポイント」列には1 つの値があります。
- チーム A のポジション G の「ポイント」列には2 つの値があります。
等々。
方法 2: 一意のカウントを持つ Pandas ピボットテーブルを作成する
次のコードは、DataFrame 内の各「チーム」と「ポジション」の一意の「ポイント」値の合計数を表示するピボット テーブルをパンダで作成する方法を示しています。
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=pd. Series . nunique )
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 1.0
B NaN 2.0 1.0
結果から次のことがわかります。
- チーム A のポジション C の「ポイント」列には1 つの一意の値があります。
- ポジション F のチーム A の「ポイント」列には1 つの一意の値があります。
- ポジション G のチーム A の「ポイント」列には1 つの一意の値があります。
等々。
注: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。
パンダ: DataFrame を長いものから広いものに再形成する方法
パンダ: DataFrame を幅広から長さに変更する方法
パンダ: 複数の列をグループ化して集計する方法