Hoe de standaardafwijking per groep bij panda's te berekenen
Je kunt de volgende methoden gebruiken om de standaardafwijking per groep bij panda’s te berekenen:
Methode 1: Bereken de standaardafwijking van een kolom gegroepeerd per kolom
df. groupby ([' group_col '])[' value_col ']. std ()
Methode 2: Bereken de standaardafwijking van meerdere kolommen gegroepeerd in één kolom
df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()
Methode 3: Bereken de standaardafwijking van een kolom gegroepeerd door meerdere kolommen
df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'], ' points ': [30, 22, 19, 14, 14, 11, 20, 28], ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]}) #view DataFrame print (df) team position points assists 0 AG 30 4 1 AF 22 3 2 FY 19 7 3 AG 14 7 4 BF 14 12 5 BF 11 15 6 BG 20 8 7 BG 28 4
Voorbeeld 1: Bereken de standaardafwijking van een kolom gegroepeerd per kolom
De volgende code laat zien hoe u de standaardafwijking van de puntenkolom berekent, gegroepeerd per teamkolom :
#calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()
team
A 6.70199
B 7.50000
Name: points, dtype: float64
Uit het resultaat kunnen we zien:
- De standaardafwijking van de punten van team A is 6,70199 .
- De standaardafwijking van punten voor team B is 7,5 .
Voorbeeld 2: Bereken de standaardafwijking van meerdere kolommen gegroepeerd op één kolom
De volgende code laat zien hoe je de standaardafwijking van de puntenkolom en de standaardafwijking van de assistskolom berekent, gegroepeerd op de teamkolom :
#calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()
assist points
team
A 6.70199 2.061553
B 7.50000 4.787136
Het resultaat toont de standaardafwijking van de puntenkolom en de assistenkolom voor elk team.
Voorbeeld 3: Bereken de standaardafwijking van een kolom gegroepeerd door meerdere kolommen
De volgende code laat zien hoe u de standaardafwijking van de puntenkolom berekent, gegroepeerd op team- en positiekolommen :
#calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()
team position
AF 2.121320
G 11.313708
BF 2.121320
G 5.656854
Name: points, dtype: float64
Uit het resultaat kunnen we zien:
- De standaardafwijking van de punten van de spelers van team A en positie F is 2,12 .
- De standaardafwijking van de punten van de spelers van team A en positie G is 11,31 .
- De standaardafwijking van de punten van de spelers van team B en positie F is 2,12 .
- De standaardafwijking van de punten van de spelers van team B en positie G is 5,65 .
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende panda-taken kunt uitvoeren:
Hoe het groepsgemiddelde bij panda’s te berekenen
Hoe de maximale waarde per groep in Panda’s te berekenen
Zo bereken je het bedrag per groep bij Pandas
Hoe kwantielen per groep in Panda’s te berekenen