Pandas: как создать сводную таблицу с количеством значений


Вы можете использовать любой из следующих методов для создания сводной таблицы в pandas, которая отображает количество значений в определенных столбцах:

Метод 1: сводная таблица с числами

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=' count ')

Способ 2: сводная таблица с уникальными числами

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=pd. Series . nunique )

В следующих примерах показано, как использовать каждый метод со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B F 5
6 B F 5
7 B F 12

Способ 1. Создайте сводную таблицу Pandas со счетчиками

Следующий код показывает, как создать сводную таблицу в pandas, которая отображает общее количество значений «баллов» для каждой «команды» и «позиции» в DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' count ')

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 2.0
   B NaN 3.0 1.0

По результату мы видим:

  • В столбце «очки» для команды А на позиции С указано 1 значение.
  • В столбце «очки» для команды А на позиции F указано 1 значение.
  • В столбце «очки» для команды А на позиции G имеется 2 значения.

И так далее.

Способ 2. Создайте сводную таблицу Pandas с уникальными счетчиками

Следующий код показывает, как создать сводную таблицу в pandas, которая отображает уникальное общее количество значений «баллов» для каждой «команды» и «позиции» в DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=pd. Series . nunique )

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 1.0
   B NaN 2.0 1.0

По результату мы видим:

  • В столбце «Очки» для команды А на позиции C имеется 1 уникальное значение.
  • В столбце «очки» имеется 1 уникальное значение для команды А на позиции F.
  • В столбце «очки» указано 1 уникальное значение для команды А на позиции G.

И так далее.

Примечание . Полную документацию по функции pandas Pivot_table() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Pandas: как изменить форму DataFrame с длинного на широкий
Pandas: как изменить форму DataFrame с широкой на длинную
Pandas: как группировать и агрегировать по нескольким столбцам

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *