Panda: come aggiungere un filtro alla tabella pivot


È possibile utilizzare la seguente sintassi di base per aggiungere una condizione di filtro a una tabella pivot Pandas:

 df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')

Questo particolare esempio crea una tabella pivot che visualizza la somma dei valori di col2 e col3 , raggruppati per col1 .

Il filtro prima della funzione pivot_table() specifica che vogliamo includere solo le righe in cui il valore in col1 del DataFrame originale ha il valore “A”.

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: come aggiungere un filtro alla tabella pivot di Pandas

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Possiamo utilizzare il seguente codice per creare una tabella pivot in panda che visualizzi la somma dei valori nelle colonne punti e assist raggruppate per squadra solo per le righe in cui il DataFrame originale ha un valore nella colonna punteggio. squadra pari ad “A”:

 #create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
                                 aggfunc=' sum ')

        assist points
team		
At 14 18

Tieni presente che la tabella pivot riassume solo i valori dei punti e delle colonne di assistenza per le righe in cui la squadra è uguale ad “A”.

È inoltre possibile utilizzare gli operatori & e | per applicare un filtro che utilizza la logica “AND” o “OR”.

Ad esempio, possiamo utilizzare la seguente sintassi per creare una tabella pivot che filtra le righe in cui il valore nella colonna del team del DataFrame originale è uguale a “A” o “B”:

 #create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
                                                    values=[' points ', ' assists '],
                                                    aggfunc=' sum ')

	assist points
team		
At 14 18
B 19 26

Tieni presente che la tabella pivot riassume solo i valori nelle colonne punti e assist per le righe in cui la squadra è uguale a “A” o “B”.

Nota : puoi trovare la documentazione completa della funzione panda pivot_table() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Panda: come ordinare la tabella pivot in base ai valori nella colonna
Panda: come creare una tabella pivot con una somma di valori
Panda: come aggiungere totali parziali alla tabella pivot
Panda: come modificare i nomi delle colonne in una tabella pivot

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *