Panda: come contare combinazioni uniche di due colonne
È possibile utilizzare la seguente sintassi per contare il numero di combinazioni univoche su due colonne in un DataFrame panda:
df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: conteggio di combinazioni uniche di due colonne in Panda
Supponiamo di avere il seguente DataFrame panda che mostra la squadra e la posizione di vari giocatori di basket:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat', 'Heat'], ' position ': ['Guard', 'Guard', 'Guard', 'Forward', 'Guard', 'Forward', 'Forward', 'Guard']}) #view DataFrame df team position 0 Mavs Guard 1 Mavs Guard 2 Mavs Guard 3 Mavs Forward 4 Heat Guard 5 Heat Forward 6 Heat Forward 7 Heat Guard
Possiamo utilizzare la seguente sintassi per contare il numero di combinazioni uniche di squadra e posizione :
df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ') team position count 0 Mavs Guard 3 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Forward 1
Dal risultato possiamo vedere:
- Ci sono 3 occorrenze della combinazione Mavs-Guard.
- Ci sono 2 occorrenze della combinazione Heat-Forward.
- Ci sono 2 occorrenze della combinazione Heat-Guard.
- C’è 1 occorrenza della combinazione Mavs-Forward.
Tieni presente che puoi anche ordinare i risultati in ordine crescente o decrescente.
Ad esempio, possiamo utilizzare il seguente codice per ordinare i risultati in ordine numerico crescente :
df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ') team position count 0 Mavs Forward 1 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Guard 3
I risultati sono ora ordinati per numero, dal più piccolo al più grande.
Nota : puoi trovare la documentazione completa della funzione panda value_counts() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Panda: come utilizzare GroupBy e conteggi dei valori
Panda: come utilizzare GroupBy con il conteggio dei contenitori
Panda: come creare una tabella pivot con numero di valori