Pandy: jak liczyć unikalne kombinacje dwóch kolumn


Możesz użyć następującej składni, aby policzyć liczbę unikalnych kombinacji w dwóch kolumnach w ramce danych pandy:

 df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: liczenie unikalnych kombinacji dwóch kolumn w Pandach

Załóżmy, że mamy następującą ramkę danych pand, która pokazuje drużynę i pozycję różnych koszykarzy:

 import pandas as pd

#create dataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs',
                            'Heat', 'Heat', 'Heat', 'Heat'],
                   ' position ': ['Guard', 'Guard', 'Guard', 'Forward',
                                'Guard', 'Forward', 'Forward', 'Guard']})
#view DataFrame
df

        team position
0 Mavs Guard
1 Mavs Guard
2 Mavs Guard
3 Mavs Forward
4 Heat Guard
5 Heat Forward
6 Heat Forward
7 Heat Guard

Możemy użyć następującej składni, aby policzyć liczbę unikalnych kombinacji zespołu i pozycji :

 df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ')

        team position count
0 Mavs Guard 3
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Forward 1

Z wyniku możemy zobaczyć:

  • Istnieją 3 wystąpienia kombinacji Mavs-Guard.
  • Istnieją 2 wystąpienia kombinacji Heat-Forward.
  • Istnieją 2 wystąpienia kombinacji Heat-Guard.
  • Wystąpiło 1 wystąpienie kombinacji Mavs-Forward.

Pamiętaj, że możesz także sortować wyniki w kolejności rosnącej lub malejącej.

Na przykład możemy użyć następującego kodu, aby posortować wyniki w porządku rosnącym według liczb:

 df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ')

        team position count
0 Mavs Forward 1
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Guard 3

Wyniki są teraz sortowane według liczb, od najmniejszego do największego.

Uwaga : pełną dokumentację funkcji panda value_counts() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: Jak korzystać z GroupBy z liczbą pojemników
Pandy: Jak utworzyć tabelę przestawną z liczbą wartości

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *