Panda: come concatenare stringhe utilizzando groupby


È possibile utilizzare la seguente sintassi di base per concatenare stringhe da GroupBy in panda:

 df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join })

Questa particolare formula raggruppa le righe in base alla colonna group_var , quindi concatena le stringhe nella colonna string_var .

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: come concatenare stringhe utilizzando GroupBy

Supponiamo di avere i seguenti panda DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' quarter ': [1, 1, 2, 2, 1, 1, 2, 2],
                   ' employee ': ['Andy', 'Bob', 'Chad', 'Diane',
                                'Elana', 'Frank', 'George', 'Hank']})

#view DataFrame
print (df)

Possiamo utilizzare la seguente sintassi per raggruppare le righe del DataFrame per negozio e trimestre e poi concatenare le stringhe nella colonna Employee :

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':''. join })

	store quarter employee
0 To 1 Andy Bob
1 A 2 Chad Diane
2 B 1 Elana Frank
3 B 2 George Hank

Il risultato è un DataFrame raggruppato per negozio e trimestre con le stringhe della colonna dei dipendenti concatenate con uno spazio.

Potremmo anche concatenare le stringhe utilizzando un separatore diverso come il simbolo & :

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':' & '. join })

	store quarter employee
0 To 1 Andy & Bob
1 A 2 Chad & Diane
2 B 1 Elana & Frank
3 B 2 George & Hank

Tieni presente che le stringhe nella colonna dipendente ora sono separate dal simbolo & .

Nota : puoi trovare la documentazione completa dell’operazione GroupBy in panda qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Panda: come calcolare il cumulato per gruppo
Panda: come contare i valori unici per gruppo
Panda: come calcolare la correlazione per gruppo

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *