Panda's: hoe nan-waarden in draaitabel te vervangen door nullen


Je kunt het argument fill_value in panda’s gebruiken om NaN-waarden in een draaitabel te vervangen door nullen.

Om dit te doen, kunt u de volgende basissyntaxis gebruiken:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Vervang NaN-waarden in draaitabel door nullen

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B F 9
5 B F 5
6 B F 5
7 B F 12

We kunnen de volgende code gebruiken om een draaitabel in panda’s te maken die de gemiddelde puntwaarde voor elk team en elke positie in het DataFrame weergeeft:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')

#view pivot table
print (df_pivot)

CFG position
team                    
A 8.0 6.00 4.0
B NaN 7.75 NaN

Merk op dat er twee NaN-waarden in de draaitabel staan omdat geen enkele speler een C- of G- positie heeft in team B in het originele DataFrame, dus deze twee posities hebben NaN-waarden in de draaitabel.

Om deze NaN-waarden met nullen in de draaitabel te vullen, kunnen we het fill_value- argument gebruiken:

 #create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          fill_value= 0 )

#view pivot table
print (df_pivot)

CFG position
team                
A 8 6.00 4
B 0 7.75 0

Merk op dat elk van de NaN-waarden in de vorige draaitabel is opgevuld met nullen.

Opmerking : u kunt hier de volledige documentatie van de pandas pivot_table() -functie vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Panda’s: hoe u het DataFrame kunt hervormen van lang naar breed
Panda’s: hoe u het DataFrame kunt hervormen van breed naar lang
Panda’s: hoe te groeperen en aggregeren over meerdere kolommen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert