Pandas: so berechnen sie den modus in einem groupby-objekt


Sie können die folgende Syntax verwenden, um den Modus in einem GroupBy-Objekt in Pandas zu berechnen:

 df. groupby ([' group_var '])[' value_var ']. agg ( pd.Series.mode )

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Berechnungsmodus in einem GroupBy-Objekt

Angenommen, wir haben den folgenden Pandas-DataFrame, der die von Basketballspielern verschiedener Teams erzielten Punkte anzeigt:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [10, 10, 12, 15, 19, 23, 20, 20, 26]})

#view DataFrame
print (df)

  team points
0 to 10
1 to 10
2 to 12
3 to 15
4 B 19
5 B 23
6 C 20
7 C 20
8 C 26

Wir können die folgende Syntax verwenden, um den Modepunktwert für jedes Team zu berechnen:

 #calculate mode points value for each team
df. groupby ([' team '])[' points ']. agg ( pd.Series.mode )

team
At 10
B [19, 23]
C 20
Name: points, dtype: object

So interpretieren Sie das Ergebnis:

  • Der Modepunktwert für Team A beträgt 10 .
  • Die Modepunktwerte für Team B liegen bei 19 und 23 .
  • Der Modepunktwert für Team C beträgt 20 .

Wenn eine Gruppe über mehrere Modi verfügt, können Sie die folgende Syntax verwenden, um jeden Modus in einer anderen Zeile anzuzeigen:

 #calculate mode points value for each team
df. groupby ([' team '])[' points ']. apply ( pd.Series.mode )

team   
At 0 10
B 0 19
      1 23
C 0 20
Name: points, dtype: int64

Hinweis : Die vollständige Dokumentation der GroupBy-Operation in Pandas finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

Pandas: So berechnen Sie die kumulative Summe pro Gruppe
Pandas: So zählen Sie eindeutige Werte nach Gruppen
Pandas: So berechnen Sie die Korrelation nach Gruppen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert