Pandas: so verwenden sie as_index in groupby
Sie können das Argument as_index in einer pandas -groupby() -Operation verwenden, um anzugeben, ob die Spalte, nach der Sie gruppiert haben, als Index der Ausgabe verwendet werden soll oder nicht.
Das Argument as_index kann True oder False sein.
Der Standardwert ist True .
Das folgende Beispiel zeigt, wie das Argument as_index in der Praxis verwendet wird.
Beispiel: Verwendung von as_index in Pandas Groupby
Angenommen, wir haben den folgenden Pandas-DataFrame, der die Anzahl der von Basketballspielern verschiedener Teams erzielten Punkte anzeigt:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
#view DataFrame
print (df)
team points
0 to 12
1 to 15
2 to 17
3 to 17
4 to 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28
Wir können die folgende Syntax verwenden, um Zeilen nach Teamspalte zu gruppieren und die Punktespaltensumme zu berechnen, während wir as_index=True angeben, um Team als Ausgabeindex zu verwenden:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= True ) .sum ())
points
team
At 80
B29
C 72
Die Ausgabe zeigt die Summe der Werte in der Punktespalte , gruppiert nach den Werten in der Teamspalte .
Beachten Sie, dass die Teamspalte als Index der Ausgabe verwendet wird.
Wenn wir stattdessen as_index=False angeben, wird die Teamspalte nicht als Ausgabeindex verwendet:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= False ) .sum ())
team points
0 to 80
1 B 29
2 C 72
Beachten Sie, dass „team“ jetzt als Spalte in der Ausgabe verwendet wird und die Indexspalte einfach mit 0–2 nummeriert ist.
Hinweis : Die vollständige Dokumentation der Pandas- Groupby() -Operation finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So erstellen Sie eine Gruppe nach der Verwendung von Pandas Groupby
So konvertieren Sie die Pandas GroupBy-Ausgabe in DataFrame
So wenden Sie eine Funktion auf Pandas Groupby an