Pandas: як додати проміжні підсумки до зведеної таблиці


Часто ви можете додати проміжні підсумки до зведеної таблиці pandas.

На щастя, це легко зробити за допомогою вбудованих функцій pandas.

У наступному прикладі показано, як це зробити.

Приклад: додайте проміжні підсумки до зведеної таблиці Pandas

Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'],
                   ' all_star ': ['Y', 'N', 'Y', 'Y', 'N', 'N', 'N', 'Y'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

  team position all_star points
0 AGY 4
1 AGN 4
2 AFY 6
3 AFY 8
4 BGN 9
5 BFN 5
6 BFN 5
7 BFY 12

Ми можемо використати наступний код, щоб створити зведену таблицю в pandas, яка відображає суму очок для кожної комбінації team , all_star і position у DataFrame:

 #create pivot table
my_table = pd. pivot_table (df, values=' points ',
                              index=[' team ', ' all_star '],
                              columns=' position ',
                              aggfunc=' sum ')

#view pivot table
print (my_table)

FG position
team all_star           
AN NaN 4.0
     Y 14.0 4.0
BN 10.0 9.0
     Y 12.0 NaN

Тепер припустімо, що ми хочемо додати рядок проміжних підсумків , який відображає проміжні очки для кожної команди та позиції.

Для цього ми можемо використати такий синтаксис:

 #add subtotals row to pivot table
p.d. concat ([
    y. append ( y.sum (). rename ((x, ' Total ')))
    for x, y in my_table. groupby (level= 0 )
]). append ( my_table.sum (). rename ((' Large ', ' Total ')))

	position F G
team all_star		
A N NaN 4.0
               Y 7.0 4.0
           Overall 7.0 8.0
B N 5.0 9.0
               Y 12.0 NaN
           Total 17.0 9.0
Grand Total 24.0 17.0

Тепер у нас є два рядки проміжних підсумків, які показують проміжні очки для кожної команди та позиції, а також рядок загального підсумку, який показує загальний підсумок для кожного стовпця.

Примітка . Ви можете знайти повну документацію щодо функції pandas pivot_table() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Pandas: Як створити зведену таблицю з кількістю значень
Pandas: як замінити значення NaN у зведеній таблиці на нулі
Pandas: Як перетворити PivotTable на DataFrame

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *