Panda: come contare combinazioni uniche di due colonne


È possibile utilizzare la seguente sintassi per contare il numero di combinazioni univoche su due colonne in un DataFrame panda:

 df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: conteggio di combinazioni uniche di due colonne in Panda

Supponiamo di avere il seguente DataFrame panda che mostra la squadra e la posizione di vari giocatori di basket:

 import pandas as pd

#create dataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs',
                            'Heat', 'Heat', 'Heat', 'Heat'],
                   ' position ': ['Guard', 'Guard', 'Guard', 'Forward',
                                'Guard', 'Forward', 'Forward', 'Guard']})
#view DataFrame
df

        team position
0 Mavs Guard
1 Mavs Guard
2 Mavs Guard
3 Mavs Forward
4 Heat Guard
5 Heat Forward
6 Heat Forward
7 Heat Guard

Possiamo utilizzare la seguente sintassi per contare il numero di combinazioni uniche di squadra e posizione :

 df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ')

        team position count
0 Mavs Guard 3
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Forward 1

Dal risultato possiamo vedere:

  • Ci sono 3 occorrenze della combinazione Mavs-Guard.
  • Ci sono 2 occorrenze della combinazione Heat-Forward.
  • Ci sono 2 occorrenze della combinazione Heat-Guard.
  • C’è 1 occorrenza della combinazione Mavs-Forward.

Tieni presente che puoi anche ordinare i risultati in ordine crescente o decrescente.

Ad esempio, possiamo utilizzare il seguente codice per ordinare i risultati in ordine numerico crescente :

 df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ')

        team position count
0 Mavs Forward 1
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Guard 3

I risultati sono ora ordinati per numero, dal più piccolo al più grande.

Nota : puoi trovare la documentazione completa della funzione panda value_counts() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Panda: come utilizzare GroupBy e conteggi dei valori
Panda: come utilizzare GroupBy con il conteggio dei contenitori
Panda: come creare una tabella pivot con numero di valori

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *