Pandas: как заменить значения nan в сводной таблице нулями
Вы можете использовать аргумент fill_value в pandas для замены значений NaN в сводной таблице нулями.
Для этого вы можете использовать следующий базовый синтаксис:
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: заменить значения NaN в сводной таблице нулями
Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B F 9 5 B F 5 6 B F 5 7 B F 12
Мы можем использовать следующий код для создания сводной таблицы в pandas, которая показывает среднее значение баллов для каждой команды и позиции в DataFrame:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (df_pivot)
CFG position
team
A 8.0 6.00 4.0
B NaN 7.75 NaN
Обратите внимание, что в сводной таблице есть два значения NaN, поскольку ни один игрок не имеет позиции C или G в команде B в исходном DataFrame, поэтому эти две позиции имеют значения NaN в сводной таблице.
Чтобы заполнить эти значения NaN нулями в сводной таблице, мы можем использовать аргумент fill_value :
#create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
fill_value= 0 )
#view pivot table
print (df_pivot)
CFG position
team
A 8 6.00 4
B 0 7.75 0
Обратите внимание, что каждое из значений NaN в предыдущей сводной таблице дополнено нулями.
Примечание . Полную документацию по функции pandas Pivot_table() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Pandas: как изменить форму DataFrame с длинного на широкий
Pandas: как изменить форму DataFrame с широкой на длинную
Pandas: как группировать и агрегировать по нескольким столбцам