Pandas: 値の数を含むピボット テーブルを作成する方法


次のいずれかの方法を使用して、特定の列の値の数を表示するピボット テーブルをパンダで作成できます。

方法 1: 数値を使用したピボット テーブル

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=' count ')

方法 2: 一意の番号を含むピボットテーブル

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=pd. Series . nunique )

次の例は、次の pandas DataFrame で各メソッドを使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B F 5
6 B F 5
7 B F 12

方法 1: カウントを含む Pandas ピボットテーブルを作成する

次のコードは、DataFrame 内の各「チーム」と「ポジション」の「ポイント」値の合計数を表示するピボット テーブルをパンダで作成する方法を示しています。

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' count ')

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 2.0
   B NaN 3.0 1.0

結果から次のことがわかります。

  • チーム A のポジション C の「ポイント」列には1 つの値があります。
  • チーム A のポジション F の「ポイント」列には1 つの値があります。
  • チーム A のポジション G の「ポイント」列には2 つの値があります。

等々。

方法 2: 一意のカウントを持つ Pandas ピボットテーブルを作成する

次のコードは、DataFrame 内の各「チーム」と「ポジション」の一意の「ポイント」値の合計数を表示するピボット テーブルをパンダで作成する方法を示しています。

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=pd. Series . nunique )

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 1.0
   B NaN 2.0 1.0

結果から次のことがわかります。

  • チーム A のポジション C の「ポイント」列には1 つの一意の値があります。
  • ポジション F のチーム A の「ポイント」列には1 つの一意の値があります。
  • ポジション G のチーム A の「ポイント」列には1 つの一意の値があります。

等々。

: pandas pivot_table()関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

パンダ: DataFrame を長いものから広いものに再形成する方法
パンダ: DataFrame を幅広から長さに変更する方法
パンダ: 複数の列をグループ化して集計する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です