Pandas: как добавить фильтр в сводную таблицу


Вы можете использовать следующий базовый синтаксис, чтобы добавить условие фильтра в сводную таблицу pandas:

 df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')

В этом конкретном примере создается сводная таблица, отображающая сумму значений col2 и col3 , сгруппированных по col1 .

Фильтр перед функцией Pivot_table() указывает, что мы хотим включать только строки, в которых значение в столбце 1 исходного DataFrame имеет значение «A».

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: как добавить фильтр в сводную таблицу Pandas

Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Мы можем использовать следующий код для создания сводной таблицы в pandas, которая отображает сумму значений в столбцах точек и вспомогательных столбцов, сгруппированных по командам , только для строк, где исходный DataFrame имеет значение в столбце оценки. команда равная «А»:

 #create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
                                 aggfunc=' sum ')

        assist points
team		
At 14 18

Обратите внимание, что в сводной таблице суммируются значения столбцов очков и передач только для строк, где команда равна «А».

Вы также можете использовать операторы & и | чтобы применить фильтр, использующий логику «И» или «ИЛИ».

Например, мы можем использовать следующий синтаксис для создания сводной таблицы, которая фильтрует строки, в которых значение в столбце команды исходного DataFrame равно «A» или «B»:

 #create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
                                                    values=[' points ', ' assists '],
                                                    aggfunc=' sum ')

	assist points
team		
At 14 18
B 19 26

Обратите внимание, что сводная таблица суммирует значения в столбцах очков и передач только для строк, где команда равна «A» или «B».

Примечание . Полную документацию по функции pandas Pivot_table() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Pandas: как отсортировать сводную таблицу по значениям в столбце
Pandas: как создать сводную таблицу с суммой значений
Pandas: как добавить промежуточные итоги в сводную таблицу
Pandas: как изменить имена столбцов в сводной таблице

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *