So berechnen sie die standardabweichung pro gruppe bei pandas
Sie können die folgenden Methoden verwenden, um die Standardabweichung pro Gruppe in Pandas zu berechnen:
Methode 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte
df. groupby ([' group_col '])[' value_col ']. std ()
Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte
df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()
Methode 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte
df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'], ' points ': [30, 22, 19, 14, 14, 11, 20, 28], ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]}) #view DataFrame print (df) team position points assists 0 AG 30 4 1 AF 22 3 2 FY 19 7 3 AG 14 7 4 BF 14 12 5 BF 11 15 6 BG 20 8 7 BG 28 4
Beispiel 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte
Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Teamspalte , berechnet wird:
#calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()
team
A 6.70199
B 7.50000
Name: points, dtype: float64
Aus dem Ergebnis können wir sehen:
- Die Standardabweichung der Punkte von Team A beträgt 6,70199 .
- Die Standardabweichung der Punkte für Team B beträgt 7,5 .
Beispiel 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte
Der folgende Code zeigt, wie die Standardabweichung der Punktespalte und die Standardabweichung der Assists- Spalte, gruppiert nach der Teams- Spalte, berechnet werden:
#calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()
assist points
team
A 6.70199 2.061553
B 7.50000 4.787136
Das Ergebnis zeigt die Standardabweichung der Punktespalte und der Assists- Spalte für jedes Team an.
Beispiel 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte
Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Team- und Positionsspalten , berechnet wird:
#calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()
team position
AF 2.121320
G 11.313708
BF 2.121320
G 5.656854
Name: points, dtype: float64
Aus dem Ergebnis können wir sehen:
- Die Standardabweichung der Punkte der Spieler von Team A und Position F beträgt 2,12 .
- Die Standardabweichung der Punkte der Spieler von Team A und Position G beträgt 11,31 .
- Die Standardabweichung der Punkte der Spieler von Team B und Position F beträgt 2,12 .
- Die Standardabweichung der Punkte der Spieler von Team B und Position G beträgt 5,65 .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:
So berechnen Sie den Gruppendurchschnitt bei Pandas
So berechnen Sie den Maximalwert pro Gruppe in Pandas
So berechnen Sie den Betrag pro Gruppe bei Pandas
So berechnen Sie Quantile nach Gruppe in Pandas