Come calcolare la media delle colonne in pandas
Spesso potresti essere interessato a calcolare la media di una o più colonne in un DataFrame panda. Fortunatamente, puoi farlo facilmente nei panda usando la funzione Mean() .
Questo tutorial mostra diversi esempi di utilizzo di questa funzione.
Esempio 1: trova la media di una singola colonna
Supponiamo di avere i seguenti panda DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df player points assists rebounds 0 A 25 5 NaN 1 B 20 7 8.0 2 C 14 7 10.0 3 D 16 8 6.0 4 E 27 5 6.0 5 F 20 7 9.0 6 G 12 6 6.0 7:15 9 10.0 8 I 14 9 10.0 9 D 19 5 7.0
Possiamo trovare la media della colonna denominata “punti” utilizzando la seguente sintassi:
df['points']. mean ()
18.2
Anche la funzione Mean() escluderà le NA per impostazione predefinita. Se ad esempio troviamo la media della colonna “rimbalzi”, il primo valore di “NaN” verrà semplicemente escluso dal calcolo:
df['rebounds']. mean ()
8.0
Se provi a trovare la media di una colonna non numerica, riceverai un errore:
df['player']. mean ()
TypeError: Could not convert ABCDEFGHIJ to numeric
Esempio 2: trova la media di più colonne
Possiamo trovare la media di più colonne utilizzando la seguente sintassi:
#find mean of points and rebounds columns df[['rebounds', 'points']]. mean () rebounds 8.0 points 18.2 dtype:float64
Esempio 3: trova la media di tutte le colonne
Possiamo anche trovare la media di tutte le colonne numeriche utilizzando la seguente sintassi:
#find mean of all numeric columns in DataFrame df. mean () points 18.2 assists 6.8 rebounds 8.0 dtype:float64
Tieni presente che la funzione Mean() ignorerà semplicemente le colonne che non sono numeriche.
Risorse addizionali
Come calcolare la mediana nei panda
Come calcolare la somma delle colonne in Pandas
Come trovare il valore massimo delle colonne in Pandas