Come calcolare la deviazione standard per gruppo nei panda


È possibile utilizzare i seguenti metodi per calcolare la deviazione standard per gruppo nei panda:

Metodo 1: calcola la deviazione standard di una colonna raggruppata per una colonna

 df. groupby ([' group_col '])[' value_col ']. std ()

Metodo 2: calcola la deviazione standard di più colonne raggruppate da una singola colonna

 df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. std ()

Metodo 3: calcola la deviazione standard di una colonna raggruppata per più colonne

 df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. std ()

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]})

#view DataFrame
print (df)

  team position points assists
0 AG 30 4
1 AF 22 3
2 FY 19 7
3 AG 14 7
4 BF 14 12
5 BF 11 15
6 BG 20 8
7 BG 28 4

Esempio 1: calcola la deviazione standard di una colonna raggruppata per una colonna

Il codice seguente mostra come calcolare la deviazione standard della colonna dei punti , raggruppati per colonna della squadra :

 #calculate standard deviation of points grouped by team
df. groupby (' team ')[' points ']. std ()

team
A 6.70199
B 7.50000
Name: points, dtype: float64

Dal risultato possiamo vedere:

  • La deviazione standard dei punti della Squadra A è 6.70199 .
  • La deviazione standard dei punti per la squadra B è 7,5 .

Esempio 2: calcola la deviazione standard di più colonne raggruppate da una singola colonna

Il seguente codice mostra come calcolare la deviazione standard della colonna dei punti e la deviazione standard della colonna degli assist , raggruppate per la colonna delle squadre :

 #calculate standard deviation of points and assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. std ()

	assist points
team		
A 6.70199 2.061553
B 7.50000 4.787136

Il risultato mostra la deviazione standard della colonna dei punti e della colonna degli assist per ciascuna squadra.

Esempio 3: calcolare la deviazione standard di una colonna raggruppata per più colonne

Il codice seguente mostra come calcolare la deviazione standard della colonna dei punti , raggruppati per colonne di squadra e posizione :

 #calculate standard deviation of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. std ()

team position
AF 2.121320
      G 11.313708
BF 2.121320
      G 5.656854
Name: points, dtype: float64

Dal risultato possiamo vedere:

  • La deviazione standard dei punti dei giocatori della squadra A e della posizione F è 2,12 .
  • La deviazione standard dei punti dei giocatori della squadra A e della posizione G è 11,31 .
  • La deviazione standard dei punti dei giocatori della squadra B e della posizione F è 2,12 .
  • La deviazione standard dei punti dei giocatori della squadra B e della posizione G è 5,65 .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni dei panda:

Come calcolare la media del gruppo nei panda
Come calcolare il valore massimo per gruppo in Panda
Come calcolare l’importo per gruppo su Pandas
Come calcolare i quantili per gruppo in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *