So berechnen sie quantile nach gruppe in pandas


Sie können die folgende grundlegende Syntax verwenden, um Quantile nach Gruppe in Pandas zu berechnen:

 df. groupby (' grouping_variable '). quantile ( .5 )

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Berechnen Sie das Quantil nach Gruppe

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd

#createDataFrame 
df = pd. DataFrame ({' team ': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
                   ' score ': [3, 4, 4, 5, 5, 8, 1, 2, 2, 3, 3, 5]})

#view first five rows
df. head ()

team score
0 1 3
1 1 4
2 1 4
3 1 5
4 1 5 

Der folgende Code zeigt, wie das 90. Perzentil der Werte in der Spalte „Punkte“, gruppiert nach der Spalte „Team“, berechnet wird:

 df. groupby (' team '). quantile ( .90 )

	score
team	
1 6.5
2 4.0

So interpretieren Sie das Ergebnis:

  • Das 90. Perzentil der „Punkte“ für Team 1 beträgt 6,5 .
  • Das 90. Perzentil der „Punkte“ für Team 2 beträgt 4,0 .

Beispiel 2: Berechnen Sie mehrere Quantile pro Gruppe

Der folgende Code zeigt, wie mehrere Quantile gleichzeitig pro Gruppe berechnet werden:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
                   ' score ': [3, 4, 4, 5, 5, 8, 1, 2, 2, 3, 3, 5]})

#create functions to calculate 1st and 3rd quartiles
def q1(x):
    return x. quantile ( 0.25 )

def q3(x):
    return x. quantile ( 0.75 )

#calculate 1st and 3rd quartiles by group
vals = {' score ': [q1, q3]}

df. groupby (' team '). agg (vals)

	score
        q1 q3
team		
1 4.0 5.0
2 2.0 3.0

So interpretieren Sie das Ergebnis:

  • Das erste und dritte Quartil der Ergebnisse von Team 1 betragen 4,0 bzw. 5,0 .
  • Das erste und dritte Quartil der Ergebnisse von Team 2 betragen 2,0 bzw. 3,0 .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere allgemeine Funktionen in Pandas ausgeführt werden:

So finden Sie den Maximalwert pro Gruppe bei Pandas
So zählen Sie Gruppensichtungen bei Pandas
So berechnen Sie den Durchschnitt der Spalten in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert