So berechnen sie die standardabweichung pro gruppe bei pandas


Sie können die folgenden Methoden verwenden, um die Standardabweichung pro Gruppe in Pandas zu berechnen:

Methode 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte

 df. groupby ([' group_col '])[' value_col ']. std ()

Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte

 df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()

Methode 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte

 df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]})

#view DataFrame
print (df)

  team position points assists
0 AG 30 4
1 AF 22 3
2 FY 19 7
3 AG 14 7
4 BF 14 12
5 BF 11 15
6 BG 20 8
7 BG 28 4

Beispiel 1: Berechnen Sie die Standardabweichung einer nach einer Spalte gruppierten Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Teamspalte , berechnet wird:

 #calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()

team
A 6.70199
B 7.50000
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

  • Die Standardabweichung der Punkte von Team A beträgt 6,70199 .
  • Die Standardabweichung der Punkte für Team B beträgt 7,5 .

Beispiel 2: Berechnen Sie die Standardabweichung mehrerer Spalten, gruppiert nach einer einzelnen Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte und die Standardabweichung der Assists- Spalte, gruppiert nach der Teams- Spalte, berechnet werden:

 #calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()

	assist points
team		
A 6.70199 2.061553
B 7.50000 4.787136

Das Ergebnis zeigt die Standardabweichung der Punktespalte und der Assists- Spalte für jedes Team an.

Beispiel 3: Berechnen Sie die Standardabweichung einer durch mehrere Spalten gruppierten Spalte

Der folgende Code zeigt, wie die Standardabweichung der Punktespalte , gruppiert nach Team- und Positionsspalten , berechnet wird:

 #calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()

team position
AF 2.121320
      G 11.313708
BF 2.121320
      G 5.656854
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

  • Die Standardabweichung der Punkte der Spieler von Team A und Position F beträgt 2,12 .
  • Die Standardabweichung der Punkte der Spieler von Team A und Position G beträgt 11,31 .
  • Die Standardabweichung der Punkte der Spieler von Team B und Position F beträgt 2,12 .
  • Die Standardabweichung der Punkte der Spieler von Team B und Position G beträgt 5,65 .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:

So berechnen Sie den Gruppendurchschnitt bei Pandas
So berechnen Sie den Maximalwert pro Gruppe in Pandas
So berechnen Sie den Betrag pro Gruppe bei Pandas
So berechnen Sie Quantile nach Gruppe in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert