Pandas: como obter um grupo após usar groupby()


Você pode usar os seguintes métodos para obter um grupo específico depois de usar a função groupby() em um DataFrame do pandas:

Método 1: Obtenha o grupo após usar groupby()

 grouped_df. get_group (' A ')

Método 2: Obtenha colunas específicas do grupo após usar groupby()

 grouped_df[[' column1 ', ' column3 ']]. get_group (' A ')

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' sales ': [12, 15, 24, 24, 14, 19, 12, 38],
                   ' refunds ': [4, 8, 7, 7, 10, 5, 4, 11]})

#view DataFrame
print (df)

  store sales refunds
0 to 12 4
1 to 15 8
2 to 24 7
3 to 24 7
4 B 14 10
5 B 19 5
6 B 12 4
7 B 38 11

Exemplo 1: Obtenha um grupo após usar groupby()

O código a seguir mostra como usar a função groupby( ) para agrupar linhas por nome de armazenamento e, em seguida, usar a função get_group() para recuperar todas as linhas pertencentes ao grupo com nome de grupo “A”:

 #group rows of DataFrame based on value in 'store' column
grouped_stores = df. groupby ([' store '])

#get all rows that belong to group name 'A'
grouped_stores. get_group (' A ')

    store sales refunds
0 to 12 4
1 to 15 8
2 to 24 7
3 to 24 7

Observe que get_group() retorna todas as linhas pertencentes ao grupo com nome de grupo “A”.

Exemplo 2: Obtenha colunas específicas do grupo após usar groupby()

O código a seguir mostra como usar a função groupby( ) para agrupar linhas por nome de loja e, em seguida, usar a função get_group() para recuperar todas as linhas pertencentes ao grupo com nome de grupo “A” apenas para colunas “vendas” e “Reembolsos” :

 #group rows of DataFrame based on value in 'store' column
grouped_stores = df. groupby ([' store '])

#get all rows that belong to group name 'A' for sales and refunds columns
grouped_stores[[' store ', ' refunds ']]. get_group (' A ')

    store refunds
0 to 4
1 to 8
2 to 7
3 to 7

Observe que get_group() retorna todas as linhas pertencentes ao grupo com nome de grupo “A” apenas para as colunas “vendas” e “reembolsos”.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como realizar uma soma GroupBy no Pandas
Como usar Groupby e Plot no Pandas
Como contar valores únicos usando GroupBy no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *