Pandas: como calcular a classificação em um objeto groupby


Você pode usar a seguinte sintaxe para calcular a ordem dos valores em um objeto GroupBy no pandas:

 df[' rank '] = df. groupby ([' group_var '])[' value_var ']. rank ()

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: calculando a classificação em um objeto GroupBy

Suponha que temos o seguinte DataFrame do pandas que mostra os pontos marcados por jogadores de basquete de diferentes times:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [10, 10, 12, 15, 19, 23, 20, 20, 26]})

#view DataFrame
print (df)

  team points
0 to 10
1 to 10
2 to 12
3 to 15
4 B 19
5 B 23
6 C 20
7 C 20
8 C 26

Podemos usar a seguinte sintaxe para calcular a classificação dos valores de pontos de cada equipe:

 #add ranking column to data frame
df[' points_rank '] = df. groupby ([' team '])[' points ']. rank ()

#view updated DataFrame
print (df)

  team points points_rank
0 to 10 1.5
1 to 10 1.5
2 to 12 3.0
3 to 15 4.0
4 B 19 1.0
5 B 23 2.0
6 C 20 1.5
7 C 20 1.5
8 C 26 3.0

Por padrão, a função Rank() atribui valores de classificação em ordem crescente e usa a classificação média em caso de empate.

No entanto, podemos usar o método bottom-up e argumentos para ordenar os valores de uma maneira diferente:

 #add ranking column to data frame
df[' points_rank '] = df. groupby ([' team '])[' points ']. rank (' dense ', ascending= False )

#view updated DataFrame
print (df)

  team points points_rank
0 to 10 3.0
1 to 10 3.0
2 to 12 2.0
3 to 15 1.0
4 B 19 2.0
5 B 23 1.0
6 C 20 2.0
7 C 20 2.0
8 C 26 1.0

Este método atribui um valor 1 ao maior valor em cada grupo.

Você pode encontrar uma lista completa de métodos de classificação que você pode usar com a função Rank() aqui .

Nota : Você pode encontrar a documentação completa da operação GroupBy no pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Pandas: como calcular a soma acumulada por grupo
Pandas: como contar valores únicos por grupo
Pandas: como calcular a correlação por grupo

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *