Panda's: hoe nan-waarden in draaitabel te vervangen door nullen
Je kunt het argument fill_value in panda’s gebruiken om NaN-waarden in een draaitabel te vervangen door nullen.
Om dit te doen, kunt u de volgende basissyntaxis gebruiken:
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Vervang NaN-waarden in draaitabel door nullen
Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B F 9 5 B F 5 6 B F 5 7 B F 12
We kunnen de volgende code gebruiken om een draaitabel in panda’s te maken die de gemiddelde puntwaarde voor elk team en elke positie in het DataFrame weergeeft:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (df_pivot)
CFG position
team
A 8.0 6.00 4.0
B NaN 7.75 NaN
Merk op dat er twee NaN-waarden in de draaitabel staan omdat geen enkele speler een C- of G- positie heeft in team B in het originele DataFrame, dus deze twee posities hebben NaN-waarden in de draaitabel.
Om deze NaN-waarden met nullen in de draaitabel te vullen, kunnen we het fill_value- argument gebruiken:
#create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
fill_value= 0 )
#view pivot table
print (df_pivot)
CFG position
team
A 8 6.00 4
B 0 7.75 0
Merk op dat elk van de NaN-waarden in de vorige draaitabel is opgevuld met nullen.
Opmerking : u kunt hier de volledige documentatie van de pandas pivot_table() -functie vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Panda’s: hoe u het DataFrame kunt hervormen van lang naar breed
Panda’s: hoe u het DataFrame kunt hervormen van breed naar lang
Panda’s: hoe te groeperen en aggregeren over meerdere kolommen