Pandas: como usar as_index em groupby
Você pode usar o argumento as_index em uma operação pandas groupby() para especificar se deseja ou não que a coluna agrupada seja usada como índice da saída.
O argumento as_index pode ser True ou False .
O padrão é Verdadeiro .
O exemplo a seguir mostra como usar o argumento as_index na prática.
Exemplo: como usar as_index no pandas groupby
Suponha que temos o seguinte DataFrame do pandas que mostra o número de pontos marcados por jogadores de basquete de diferentes times:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
#view DataFrame
print (df)
team points
0 to 12
1 to 15
2 to 17
3 to 17
4 to 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28
Podemos usar a seguinte sintaxe para agrupar linhas por coluna de equipe e calcular a soma da coluna de pontos , enquanto especificamos as_index=True para usar equipe como índice de saída:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= True ) .sum ())
points
team
At 80
B29
C 72
A saída exibe a soma dos valores da coluna de pontos , agrupados pelos valores da coluna da equipe .
Observe que a coluna team é usada como índice da saída.
Se, em vez disso, especificarmos as_index=False , a coluna da equipe não será usada como índice de saída:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= False ) .sum ())
team points
0 to 80
1 B 29
2 C 72
Observe que team agora é usado como uma coluna na saída e a coluna do índice é simplesmente numerada de 0 a 2.
Nota : Você pode encontrar a documentação completa da operação groupby() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como obter um grupo depois de usar o Pandas Groupby
Como converter a saída GroupBy do Pandas para DataFrame
Como aplicar uma função ao Pandas Groupby