Pandy: utwórz tabelę częstości opartą na wielu kolumnach


Możesz użyć następującej podstawowej składni, aby utworzyć tabelę częstości w pandach na podstawie wielu kolumn:

 df. value_counts ([' column1 ',' column2 '])

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Utwórz tabelę częstości w Pandach w oparciu o wiele kolumn

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o nazwie drużyny, pozycji i punktach zdobytych przez różnych koszykarzy:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [24, 33, 20, 15, 16, 16, 29, 25]})

#view DataFrame
print (df)

  team position points
0 AG 24
1 AG 33
2 AG 20
3 AF15
4 BG 16
5 BG 16
6 BF 29
7 BF 25

Za pomocą funkcji value_counts() możemy stworzyć tabelę częstości pokazującą występowanie każdej kombinacji wartości w kolumnach zespołu i pozycji :

 #count frequency of values in team and position columns
df. value_counts ([' team ',' position '])

team position
GA 3
BF 2
      G2
AF1
dtype: int64

Z wyników możemy zobaczyć:

  • Istnieją 3 wystąpienia drużyny A i pozycji G
  • Istnieją 2 wystąpienia drużyny B i pozycji F
  • Istnieją 2 wystąpienia drużyny B i pozycji G
  • Występuje 1 wystąpienie drużyny A i pozycji F

Zauważ, że zamiast tego możemy użyć reset_index() do zwrócenia ramki DataFrame:

 #count frequency of values in team and position columns and return DataFrame
df. value_counts ([' team ',' position ']). reset_index ()

        team position 0
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Możemy użyć funkcji rename() , aby zmienić nazwę kolumny zawierającej liczniki:

 #get frequency of values in team and position column and rename count column
df. value_counts ([' team ',' position ']). reset_index (). rename (columns={0:' count '})

        team position count
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Efektem końcowym jest DataFrame, która zawiera częstotliwość każdej unikalnej kombinacji wartości w kolumnach Zespół i Pozycja .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: Jak korzystać z GroupBy z liczbą pojemników
Pandy: Jak liczyć wartości w kolumnie z warunkiem

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *