Pandas:如何创建包含多个值的数据透视表


您可以使用以下任何方法在 pandas 中创建数据透视表,显示某些列中值的数量:

方法 1:使用数字进行数据透视表

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=' count ')

方法 2:具有唯一数字的数据透视表

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=pd. Series . nunique )

以下示例展示了如何将每种方法与以下 pandas DataFrame 一起使用:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B F 5
6 B F 5
7 B F 12

方法 1:创建包含计数的 Pandas 数据透视表

以下代码展示了如何在 pandas 中创建一个数据透视表,显示 DataFrame 中每个“团队”和“位置”的“点”值总数:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' count ')

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 2.0
   B NaN 3.0 1.0

从结果我们可以看出:

  • A 队在 C 位置的“积分”栏值为1
  • A 队在位置 F 的“积分”栏中有1值。
  • A队G位置的“积分”栏有2个值。

等等。

方法 2:创建具有唯一计数的 Pandas 数据透视表

以下代码展示了如何在 pandas 中创建一个数据透视表,该表显示 DataFrame 中每个“团队”和“位置”的唯一“点”值总数:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=pd. Series . nunique )

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 1.0
   B NaN 2.0 1.0

从结果我们可以看出:

  • A 队在位置 C 的“积分”栏中有1 个唯一值。
  • A 队在位置 F 的“积分”栏中有1 个唯一值。
  • A 队在位置 G 的“积分”栏中有1 个唯一值。

等等。

注意:您可以在此处找到 pandas hub_table()函数的完整文档。

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

Pandas:如何将 DataFrame 从长到宽重塑
Pandas:如何将 DataFrame 从宽变为长
Pandas:如何跨多列进行分组和聚合

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注