Come calcolare la media delle colonne selezionate in pandas


È possibile utilizzare i seguenti metodi per calcolare i valori medi delle righe per le colonne selezionate in un DataFrame panda:

Metodo 1: calcola il valore medio della riga per tutte le colonne

 df. mean (axis= 1 )

Metodo 2: calcola il valore medio della riga per colonne specifiche

 df[[' col1 ', ' col3 ']]. mean (axis= 1 )

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [14, 19, 9, 21, 25, 29, 20, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	points assists rebounds
0 14 5 11
1 19 7 8
2 9 7 10
3 21 9 6
4 25 12 6
5 29 9 5
6 20 9 9
7 11 4 12

Metodo 1: calcola il valore medio della riga per tutte le colonne

Il codice seguente mostra come creare una nuova colonna nel DataFrame che visualizza il valore di riga medio per tutte le colonne:

 #define new column that shows the average row value for all columns
df[' average_all '] = df. mean (axis= 1 )

#view updated DataFrame
df

	points assists rebounds average_all
0 14 5 11 10.000000
1 19 7 8 11.333333
2 9 7 10 8.666667
3 21 9 6 12.000000
4 25 12 6 14.333333
5 29 9 5 14.333333
6 20 9 9 12.666667
7 11 4 12 9.000000

Ecco come interpretare il risultato:

Il valore medio della prima riga si calcola come segue: (14+5+11) / 3 = 10 .

Il valore medio della seconda riga si calcola come segue: (19+7+8) / 3 = 11,33 .

E così via.

Metodo 2: calcola il valore medio della riga per colonne specifiche

Il codice seguente mostra come calcolare il valore medio della riga solo per le colonne “punti” e “rimbalzi”:

 #define new column that shows average of row values for points and rebounds columns
df[' avg_points_rebounds '] = df[[' points ', ' rebounds ']]. mean (axis= 1 )

#view updated DataFrame
df

        points assists rebounds avg_points_rebounds
0 14 5 11 12.5
1 19 7 8 13.5
2 9 7 10 9.5
3 21 9 6 13.5
4 25 12 6 15.5
5 29 9 5 17.0
6 20 9 9 14.5
7 11 4 12 11.5

Ecco come interpretare il risultato:

Il valore medio di “punti” e “rimbalzi” nella prima riga è calcolato come segue: (14+11) / 2 = 12,5 .

Il valore medio di “punti” e “rimbalzi” nella seconda riga è calcolato come segue: (19+8) / 2 = 13,5 .

E così via.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in Python:

Come calcolare una media troncata in Python
Come calcolare la media geometrica in Python
Come sostituire i valori nella colonna Panda in base alla condizione

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *