Pandy: jak liczyć unikalne kombinacje dwóch kolumn
Możesz użyć następującej składni, aby policzyć liczbę unikalnych kombinacji w dwóch kolumnach w ramce danych pandy:
df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: liczenie unikalnych kombinacji dwóch kolumn w Pandach
Załóżmy, że mamy następującą ramkę danych pand, która pokazuje drużynę i pozycję różnych koszykarzy:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat', 'Heat'], ' position ': ['Guard', 'Guard', 'Guard', 'Forward', 'Guard', 'Forward', 'Forward', 'Guard']}) #view DataFrame df team position 0 Mavs Guard 1 Mavs Guard 2 Mavs Guard 3 Mavs Forward 4 Heat Guard 5 Heat Forward 6 Heat Forward 7 Heat Guard
Możemy użyć następującej składni, aby policzyć liczbę unikalnych kombinacji zespołu i pozycji :
df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ') team position count 0 Mavs Guard 3 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Forward 1
Z wyniku możemy zobaczyć:
- Istnieją 3 wystąpienia kombinacji Mavs-Guard.
- Istnieją 2 wystąpienia kombinacji Heat-Forward.
- Istnieją 2 wystąpienia kombinacji Heat-Guard.
- Wystąpiło 1 wystąpienie kombinacji Mavs-Forward.
Pamiętaj, że możesz także sortować wyniki w kolejności rosnącej lub malejącej.
Na przykład możemy użyć następującego kodu, aby posortować wyniki w porządku rosnącym według liczb:
df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ') team position count 0 Mavs Forward 1 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Guard 3
Wyniki są teraz sortowane według liczb, od najmniejszego do największego.
Uwaga : pełną dokumentację funkcji panda value_counts() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: Jak korzystać z GroupBy z liczbą pojemników
Pandy: Jak utworzyć tabelę przestawną z liczbą wartości