Hoe de standaardafwijking per groep bij panda's te berekenen

Von Dr.benjamin anderson Juli 16, 2023 Gids Keine Kommentare

Je kunt de volgende methoden gebruiken om de standaardafwijking per groep bij panda’s te berekenen:

Methode 1: Bereken de standaardafwijking van een kolom gegroepeerd per kolom

 df. groupby ([' group_col '])[' value_col ']. std ()

Methode 2: Bereken de standaardafwijking van meerdere kolommen gegroepeerd in één kolom

 df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()

Methode 3: Bereken de standaardafwijking van een kolom gegroepeerd door meerdere kolommen

 df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]})

#view DataFrame
print (df)

  team position points assists
0 AG 30 4
1 AF 22 3
2 FY 19 7
3 AG 14 7
4 BF 14 12
5 BF 11 15
6 BG 20 8
7 BG 28 4

Voorbeeld 1: Bereken de standaardafwijking van een kolom gegroepeerd per kolom

De volgende code laat zien hoe u de standaardafwijking van de puntenkolom berekent, gegroepeerd per teamkolom :

 #calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()

team
A 6.70199
B 7.50000
Name: points, dtype: float64

Uit het resultaat kunnen we zien:

De standaardafwijking van de punten van team A is 6,70199 .
De standaardafwijking van punten voor team B is 7,5 .

Voorbeeld 2: Bereken de standaardafwijking van meerdere kolommen gegroepeerd op één kolom

De volgende code laat zien hoe je de standaardafwijking van de puntenkolom en de standaardafwijking van de assistskolom berekent, gegroepeerd op de teamkolom :

 #calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()

	assist points
team		
A 6.70199 2.061553
B 7.50000 4.787136

Het resultaat toont de standaardafwijking van de puntenkolom en de assistenkolom voor elk team.

Voorbeeld 3: Bereken de standaardafwijking van een kolom gegroepeerd door meerdere kolommen

De volgende code laat zien hoe u de standaardafwijking van de puntenkolom berekent, gegroepeerd op team- en positiekolommen :

 #calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()

team position
AF 2.121320
      G 11.313708
BF 2.121320
      G 5.656854
Name: points, dtype: float64

Uit het resultaat kunnen we zien:

De standaardafwijking van de punten van de spelers van team A en positie F is 2,12 .
De standaardafwijking van de punten van de spelers van team A en positie G is 11,31 .
De standaardafwijking van de punten van de spelers van team B en positie F is 2,12 .
De standaardafwijking van de punten van de spelers van team B en positie G is 5,65 .

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende panda-taken kunt uitvoeren:

Hoe het groepsgemiddelde bij panda’s te berekenen
Hoe de maximale waarde per groep in Panda’s te berekenen
Zo bereken je het bedrag per groep bij Pandas
Hoe kwantielen per groep in Panda’s te berekenen

Über den Autor

Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder