Panda's: unieke combinaties van twee kolommen tellen
U kunt de volgende syntaxis gebruiken om het aantal unieke combinaties in twee kolommen in een pandas DataFrame te tellen:
df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: unieke combinaties van twee kolommen tellen in Panda’s
Stel dat we het volgende panda’s DataFrame hebben dat het team en de positie van verschillende basketbalspelers toont:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat', 'Heat'], ' position ': ['Guard', 'Guard', 'Guard', 'Forward', 'Guard', 'Forward', 'Forward', 'Guard']}) #view DataFrame df team position 0 Mavs Guard 1 Mavs Guard 2 Mavs Guard 3 Mavs Forward 4 Heat Guard 5 Heat Forward 6 Heat Forward 7 Heat Guard
We kunnen de volgende syntaxis gebruiken om het aantal unieke team- en positiecombinaties te tellen:
df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ') team position count 0 Mavs Guard 3 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Forward 1
Uit het resultaat kunnen we zien:
- Er zijn 3 exemplaren van de Mavs-Guard-combinatie.
- Er zijn 2 gevallen van de Heat-Forward-combinatie.
- Er zijn 2 gevallen waarin de Heat-Guard-combinatie voorkomt.
- De combinatie Mavs-Forward komt 1 keer voor.
Houd er rekening mee dat u de resultaten ook in oplopende of aflopende volgorde kunt sorteren.
We kunnen bijvoorbeeld de volgende code gebruiken om de resultaten in oplopende volgorde van nummer te sorteren:
df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ') team position count 0 Mavs Forward 1 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Guard 3
De resultaten worden nu gesorteerd op aantal, van klein naar groot.
Opmerking : u kunt hier de volledige documentatie van de pandas value_counts() -functie vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Panda’s: GroupBy gebruiken en waardetellingen
Panda’s: GroupBy gebruiken met het aantal bakken
Panda’s: hoe u een draaitabel met een aantal waarden maakt