Come calcolare la media delle colonne in pandas


Spesso potresti essere interessato a calcolare la media di una o più colonne in un DataFrame panda. Fortunatamente, puoi farlo facilmente nei panda usando la funzione Mean() .

Questo tutorial mostra diversi esempi di utilizzo di questa funzione.

Esempio 1: trova la media di una singola colonna

Supponiamo di avere i seguenti panda DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

Possiamo trovare la media della colonna denominata “punti” utilizzando la seguente sintassi:

 df['points']. mean ()

18.2

Anche la funzione Mean() escluderà le NA per impostazione predefinita. Se ad esempio troviamo la media della colonna “rimbalzi”, il primo valore di “NaN” verrà semplicemente escluso dal calcolo:

 df['rebounds']. mean ()

8.0

Se provi a trovare la media di una colonna non numerica, riceverai un errore:

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

Esempio 2: trova la media di più colonne

Possiamo trovare la media di più colonne utilizzando la seguente sintassi:

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

Esempio 3: trova la media di tutte le colonne

Possiamo anche trovare la media di tutte le colonne numeriche utilizzando la seguente sintassi:

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

Tieni presente che la funzione Mean() ignorerà semplicemente le colonne che non sono numeriche.

Risorse addizionali

Come calcolare la mediana nei panda
Come calcolare la somma delle colonne in Pandas
Come trovare il valore massimo delle colonne in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *