Pandas: как создать сводную таблицу с суммой значений


Вы можете использовать следующий базовый синтаксис для создания сводной таблицы в pandas, которая отображает сумму значений в определенных столбцах:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ')

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Создание сводной таблицы Pandas с суммой значений

Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)


  team position points
0 AG 4
1 GA 4
2 AF 6
3AF 8
4 BG 9
5 BF 5
6 BF 5
7 BF 12

Следующий код показывает, как создать сводную таблицу в pandas, которая отображает сумму значений «баллов» для каждой «команды» и «позиции» в DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ')

#view pivot table
print (df_pivot)

FG position
team           
At 14 8
B 22 9

По результату мы видим:

  • Игроки команды А на позиции F набрали в общей сложности 14 очков.
  • Игроки команды А, занимающие позицию G, набрали в общей сложности 8 очков.
  • Игроки команды Б, занимающие позицию F, набрали в общей сложности 22 очка.
  • Игроки команды Б, занимающие позицию G, набрали в общей сложности 9 очков.

Обратите внимание, что мы также можем использовать аргумент поля для отображения сумм полей в сводной таблице:

 #create pivot table with margins
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' sum ', margins= True , margins_name=' Sum ')

#view pivot table
print (df_pivot)

position FG Sum
team                 
A 14 8 22
B 22 9 31
Total 36 17 53

В сводной таблице теперь отображаются суммы строк и столбцов.

Примечание . Полную документацию по функции pandas Pivot_table() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Pandas: как изменить форму DataFrame с длинного на широкий
Pandas: как изменить форму DataFrame с широкой на длинную
Pandas: как группировать и агрегировать по нескольким столбцам

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *