So berechnen sie die standardabweichung pro gruppe bei pandas

Von Dr. Benjamin Anderson Juli 16, 2023 Führung Keine Kommentare

Sie können die folgenden Methoden verwenden, um die Standardabweichung pro Gruppe in Pandas zu berechnen:

Methode 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte

 df. groupby ([' group_col '])[' value_col ']. std ()

Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte

 df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()

Methode 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte

 df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]})

#view DataFrame
print (df)

  team position points assists
0 AG 30 4
1 AF 22 3
2 FY 19 7
3 AG 14 7
4 BF 14 12
5 BF 11 15
6 BG 20 8
7 BG 28 4

Beispiel 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Teamspalte , berechnet wird:

 #calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()

team
A 6.70199
B 7.50000
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

Die Standardabweichung der Punkte von Team A beträgt 6,70199 .
Die Standardabweichung der Punkte für Team B beträgt 7,5 .

Beispiel 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte und die Standardabweichung der Assists- Spalte, gruppiert nach der Teams- Spalte, berechnet werden:

 #calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()

	assist points
team		
A 6.70199 2.061553
B 7.50000 4.787136

Das Ergebnis zeigt die Standardabweichung der Punktespalte und der Assists- Spalte für jedes Team an.

Beispiel 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Team- und Positionsspalten , berechnet wird:

 #calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()

team position
AF 2.121320
      G 11.313708
BF 2.121320
      G 5.656854
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

Die Standardabweichung der Punkte der Spieler von Team A und Position F beträgt 2,12 .
Die Standardabweichung der Punkte der Spieler von Team A und Position G beträgt 11,31 .
Die Standardabweichung der Punkte der Spieler von Team B und Position F beträgt 2,12 .
Die Standardabweichung der Punkte der Spieler von Team B und Position G beträgt 5,65 .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:

So berechnen Sie den Gruppendurchschnitt bei Pandas
So berechnen Sie den Maximalwert pro Gruppe in Pandas
So berechnen Sie den Betrag pro Gruppe bei Pandas
So berechnen Sie Quantile nach Gruppe in Pandas

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen