Pandy: jak zastąpić wartości nan w tabeli przestawnej zerami


Możesz użyć argumentu fill_value w pandach, aby zastąpić wartości NaN w tabeli przestawnej zerami.

Aby to zrobić, możesz użyć następującej podstawowej składni:

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 )

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Zastąp wartości NaN w tabeli przestawnej zerami

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print (df)

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B F 9
5 B F 5
6 B F 5
7 B F 12

Możemy użyć poniższego kodu, aby utworzyć tabelę przestawną w pandach, która pokazuje średnią wartość punktową dla każdego zespołu i pozycji w DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')

#view pivot table
print (df_pivot)

CFG position
team                    
A 8.0 6.00 4.0
B NaN 7.75 NaN

Należy pamiętać, że w tabeli przestawnej znajdują się dwie wartości NaN, ponieważ żaden gracz nie ma pozycji C ani G w drużynie B w oryginalnej DataFrame, więc te dwie pozycje mają wartości NaN w tabeli przestawnej.

Aby wypełnić te wartości NaN zerami w tabeli przestawnej, możemy użyć argumentu fill_value :

 #create pivot table with zeros instead of NaN values
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          fill_value= 0 )

#view pivot table
print (df_pivot)

CFG position
team                
A 8 6.00 4
B 0 7.75 0

Należy pamiętać, że każda z wartości NaN w poprzedniej tabeli przestawnej została uzupełniona zerami.

Uwaga : pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Pandy: Jak zmienić kształt DataFrame z długiej na szeroką
Pandy: Jak zmienić kształt ramki danych z szerokiej na długą
Pandy: jak grupować i agregować w wielu kolumnach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *