Pandas: как заменить значения nan в сводной таблице нулями


Вы можете использовать аргумент fill_value в pandas для замены значений NaN в сводной таблице нулями.

Для этого вы можете использовать следующий базовый синтаксис:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: заменить значения NaN в сводной таблице нулями

Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B F 9
5 B F 5
6 B F 5
7 B F 12

Мы можем использовать следующий код для создания сводной таблицы в pandas, которая показывает среднее значение баллов для каждой команды и позиции в DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')

#view pivot table
print (df_pivot)

CFG position
team                    
A 8.0 6.00 4.0
B NaN 7.75 NaN

Обратите внимание, что в сводной таблице есть два значения NaN, поскольку ни один игрок не имеет позиции C или G в команде B в исходном DataFrame, поэтому эти две позиции имеют значения NaN в сводной таблице.

Чтобы заполнить эти значения NaN нулями в сводной таблице, мы можем использовать аргумент fill_value :

 #create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          fill_value= 0 )

#view pivot table
print (df_pivot)

CFG position
team                
A 8 6.00 4
B 0 7.75 0

Обратите внимание, что каждое из значений NaN в предыдущей сводной таблице дополнено нулями.

Примечание . Полную документацию по функции pandas Pivot_table() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Pandas: как изменить форму DataFrame с длинного на широкий
Pandas: как изменить форму DataFrame с широкой на длинную
Pandas: как группировать и агрегировать по нескольким столбцам

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *