Come calcolare la media del gruppo nei panda (con esempi)
È possibile utilizzare i seguenti metodi per calcolare il valore medio per gruppo tra i panda:
Metodo 1: calcola la media di una colonna raggruppata per colonna
df. groupby ([' group_col '])[' value_col ']. mean ()
Metodo 2: calcola la media di più colonne raggruppate da una singola colonna
df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. mean ()
Metodo 3: calcola la media di una colonna raggruppata per più colonne
df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. mean ()
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'], ' points ': [30, 22, 19, 14, 14, 11, 20, 28], ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]}) #view DataFrame print (df) team position points assists 0 AG 30 4 1 AF 22 3 2 FY 19 7 3 AG 14 7 4 BF 14 12 5 BF 11 15 6 BG 20 8 7 BG 28 4
Esempio 1: calcolare la media di una colonna raggruppata per colonna
Il codice seguente mostra come calcolare il valore medio della colonna punti , raggruppati per colonna squadra :
#calculate mean of points grouped by team
df. groupby (' team ')[' points ']. mean ()
team
At 9:25 p.m.
B 18.25
Name: points, dtype: float64
Dal risultato possiamo vedere:
- Il valore medio dei punti della squadra A è 21,25 .
- Il valore medio dei punti della squadra B è 18,25 .
Esempio 2: calcola la media di più colonne raggruppate da una singola colonna
Il codice seguente mostra come calcolare il valore medio della colonna punti e il valore medio della colonna assist , raggruppati per colonna squadra :
#calculate mean of points and mean of assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. mean ()
assist points
team
At 21.25 5.25
B 18.25 9.75
L’output mostra il valore medio dei punti e il valore medio degli assist per ciascuna squadra.
Esempio 3: calcolare la media di una colonna raggruppata per più colonne
Il codice seguente mostra come calcolare il valore medio della colonna dei punti , raggruppati per colonne di squadra e posizione :
#calculate mean of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. mean ()
team position
FY 20.5
G 22.0
BF 12.5
G 24.0
Name: points, dtype: float64
Dal risultato possiamo vedere:
- Il valore medio dei punti dei giocatori della squadra A e della posizione F è 20,5 .
- Il valore medio dei punti per i giocatori della squadra A e della posizione G è 22 .
- Il valore medio dei punti dei giocatori della squadra B e della posizione F è 12,5 .
- Il valore medio dei punti per i giocatori della squadra B e della posizione G è 24 .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre funzioni comuni nei panda:
Come trovare il valore massimo per gruppo su Pandas
Come trovare la somma per gruppo in panda
Come calcolare i quantili per gruppo in Pandas