Pandas: crie uma tabela de frequência baseada em múltiplas colunas


Você pode usar a seguinte sintaxe básica para criar uma tabela de frequência em pandas com base em múltiplas colunas:

 df. value_counts ([' column1 ',' column2 '])

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Crie uma tabela de frequência no Pandas com base em múltiplas colunas

Suponha que temos o seguinte DataFrame do pandas que contém informações sobre o nome do time, posição e pontos marcados por vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [24, 33, 20, 15, 16, 16, 29, 25]})

#view DataFrame
print (df)

  team position points
0 AG 24
1 AG 33
2 AG 20
3 AF15
4 BG 16
5 BG 16
6 BF 29
7 BF 25

Podemos usar a função value_counts() para criar uma tabela de frequência que mostra a ocorrência de cada combinação de valores nas colunas equipe e posição :

 #count frequency of values in team and position columns
df. value_counts ([' team ',' position '])

team position
GA 3
BF 2
      G2
AF1
dtype: int64

Dos resultados podemos ver:

  • São 3 ocorrências da equipe A e da posição G
  • São 2 ocorrências da equipe B e da posição F
  • São 2 ocorrências da equipe B e da posição G
  • 1 ocorrência da equipe A e posição F

Observe que podemos usar reset_index() para retornar um DataFrame:

 #count frequency of values in team and position columns and return DataFrame
df. value_counts ([' team ',' position ']). reset_index ()

        team position 0
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Podemos usar a função rename() para renomear a coluna que contém as contagens:

 #get frequency of values in team and position column and rename count column
df. value_counts ([' team ',' position ']). reset_index (). rename (columns={0:' count '})

        team position count
0 A G 3
1 B F 2
2 B G 2
3 A F 1

O resultado final é um DataFrame que contém a frequência de cada combinação única de valores nas colunas Equipe e Posição .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: como usar GroupBy e contagens de valores
Pandas: como usar GroupBy com contagem de bin
Pandas: Como contar valores em uma coluna com condição

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *