Pandas: so verketten sie zeichenfolgen mithilfe von groupby
Sie können die folgende grundlegende Syntax verwenden, um Zeichenfolgen aus GroupBy in Pandas zu verketten:
df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join })
Diese spezielle Formel gruppiert die Zeilen nach der Spalte „group_var“ und verkettet dann die Zeichenfolgen in der Spalte „string_var“ .
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: So verketten Sie Zeichenfolgen mithilfe von GroupBy
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' quarter ': [1, 1, 2, 2, 1, 1, 2, 2],
' employee ': ['Andy', 'Bob', 'Chad', 'Diane',
'Elana', 'Frank', 'George', 'Hank']})
#view DataFrame
print (df)
Wir können die folgende Syntax verwenden, um die Zeilen des DataFrame nach Geschäft und Quartal zu gruppieren und dann die Zeichenfolgen in der Mitarbeiterspalte zu verketten:
#group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':''. join })
store quarter employee
0 To 1 Andy Bob
1 A 2 Chad Diane
2 B 1 Elana Frank
3 B 2 George Hank
Das Ergebnis ist ein nach Geschäft und Quartal gruppierter DataFrame, wobei die Mitarbeiterspaltenzeichenfolgen mit einem Leerzeichen verkettet sind.
Wir könnten die Zeichenfolgen auch mit einem anderen Trennzeichen wie dem & -Symbol verketten:
#group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':' & '. join })
store quarter employee
0 To 1 Andy & Bob
1 A 2 Chad & Diane
2 B 1 Elana & Frank
3 B 2 George & Hank
Beachten Sie, dass die Zeichenfolgen in der Mitarbeiterspalte jetzt durch das & -Symbol getrennt sind.
Hinweis : Die vollständige Dokumentation der GroupBy-Operation in Pandas finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
Pandas: So berechnen Sie die kumulative Summe pro Gruppe
Pandas: So zählen Sie eindeutige Werte nach Gruppen
Pandas: So berechnen Sie die Korrelation nach Gruppen