Panda's: unieke combinaties van twee kolommen tellen


U kunt de volgende syntaxis gebruiken om het aantal unieke combinaties in twee kolommen in een pandas DataFrame te tellen:

 df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: unieke combinaties van twee kolommen tellen in Panda’s

Stel dat we het volgende panda’s DataFrame hebben dat het team en de positie van verschillende basketbalspelers toont:

 import pandas as pd

#create dataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs',
                            'Heat', 'Heat', 'Heat', 'Heat'],
                   ' position ': ['Guard', 'Guard', 'Guard', 'Forward',
                                'Guard', 'Forward', 'Forward', 'Guard']})
#view DataFrame
df

        team position
0 Mavs Guard
1 Mavs Guard
2 Mavs Guard
3 Mavs Forward
4 Heat Guard
5 Heat Forward
6 Heat Forward
7 Heat Guard

We kunnen de volgende syntaxis gebruiken om het aantal unieke team- en positiecombinaties te tellen:

 df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ')

        team position count
0 Mavs Guard 3
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Forward 1

Uit het resultaat kunnen we zien:

  • Er zijn 3 exemplaren van de Mavs-Guard-combinatie.
  • Er zijn 2 gevallen van de Heat-Forward-combinatie.
  • Er zijn 2 gevallen waarin de Heat-Guard-combinatie voorkomt.
  • De combinatie Mavs-Forward komt 1 keer voor.

Houd er rekening mee dat u de resultaten ook in oplopende of aflopende volgorde kunt sorteren.

We kunnen bijvoorbeeld de volgende code gebruiken om de resultaten in oplopende volgorde van nummer te sorteren:

 df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ')

        team position count
0 Mavs Forward 1
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Guard 3

De resultaten worden nu gesorteerd op aantal, van klein naar groot.

Opmerking : u kunt hier de volledige documentatie van de pandas value_counts() -functie vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Panda’s: GroupBy gebruiken en waardetellingen
Panda’s: GroupBy gebruiken met het aantal bakken
Panda’s: hoe u een draaitabel met een aantal waarden maakt

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert