Pandas: як створити зведену таблицю із сумою значень
Ви можете використовувати такий базовий синтаксис, щоб створити зведену таблицю в pandas, яка відображає суму значень у певних стовпцях:
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ')
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: створіть зведену таблицю Pandas із сумою значень
Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 AG 4 1 GA 4 2 AF 6 3AF 8 4 BG 9 5 BF 5 6 BF 5 7 BF 12
Наступний код показує, як створити зведену таблицю в pandas, яка відображає суму значень «очок» для кожної «команди» та «позиції» у DataFrame:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=' sum ')
#view pivot table
print (df_pivot)
FG position
team
At 14 8
B 22 9
З результату ми бачимо:
- Гравці команди А на позиції F набрали 14 очок.
- Гравці команди А на позиції G загалом набрали 8 очок.
- Гравці команди B на позиції F загалом набрали 22 очки.
- Гравці команди B на позиції G загалом набрали 9 очок.
Зауважте, що ми також можемо використовувати аргумент margins для відображення сум марж у зведеній таблиці:
#create pivot table with margins
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=' sum ', margins= True , margins_name=' Sum ')
#view pivot table
print (df_pivot)
position FG Sum
team
A 14 8 22
B 22 9 31
Total 36 17 53
У зведеній таблиці тепер відображаються суми рядків і стовпців.
Примітка . Ви можете знайти повну документацію щодо функції pandas pivot_table() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:
Pandas: Як змінити форму DataFrame з довгого на широкий
Pandas: Як змінити форму DataFrame із широкого на довгий
Pandas: як групувати та агрегувати в кількох стовпцях