Pandy: jak dodać filtr do tabeli przestawnej


Aby dodać warunek filtru do tabeli przestawnej Pandy, możesz użyć następującej podstawowej składni:

 df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')

Ten konkretny przykład tworzy tabelę przestawną, która wyświetla sumę wartości col2 i col3 , pogrupowanych według col1 .

Filtr przed funkcją przestawną() określa, że chcemy uwzględnić tylko wiersze, w których wartość w kolumnie 1 oryginalnej ramki DataFrame ma wartość „A”.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Jak dodać filtr do tabeli przestawnej Pandy

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Możemy użyć poniższego kodu, aby utworzyć w pandach tabelę przestawną wyświetlającą sumę wartości w punktach i kolumny pomocnicze pogrupowane według zespołu tylko dla wierszy, w których oryginalna DataFrame ma wartość w kolumnie score. drużyna równa „A”:

 #create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
                                 aggfunc=' sum ')

        assist points
team		
At 14 18

Należy pamiętać, że tabela przestawna podsumowuje wartości punktów i kolumn pomocniczych tylko dla wierszy, w których drużyna równa się „A”.

Można także używać operatorów & i | aby zastosować filtr wykorzystujący logikę „AND” lub „OR”.

Na przykład możemy użyć następującej składni, aby utworzyć tabelę przestawną, która filtruje wiersze, w których wartość w kolumnie zespołu oryginalnej ramki DataFrame jest równa „A” lub „B”:

 #create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
                                                    values=[' points ', ' assists '],
                                                    aggfunc=' sum ')

	assist points
team		
At 14 18
B 19 26

Należy pamiętać, że tabela przestawna podsumowuje tylko wartości w punktach i kolumnach pomocniczych dla wierszy, w których zespół jest równy „A” lub „B”.

Uwaga : pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak sortować tabelę przestawną według wartości w kolumnie
Pandy: Jak utworzyć tabelę przestawną z sumą wartości
Pandy: Jak dodać sumy częściowe do tabeli przestawnej
Pandy: Jak zmienić nazwy kolumn w tabeli przestawnej

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *