Как рассчитать среднее значение выбранных столбцов в pandas
Вы можете использовать следующие методы для расчета средних значений строк для выбранных столбцов в DataFrame pandas:
Способ 1. Вычислите среднее значение строки для всех столбцов.
df. mean (axis= 1 )
Способ 2: вычислить среднее значение строки для определенных столбцов
df[[' col1 ', ' col3 ']]. mean (axis= 1 )
В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [14, 19, 9, 21, 25, 29, 20, 11], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df points assists rebounds 0 14 5 11 1 19 7 8 2 9 7 10 3 21 9 6 4 25 12 6 5 29 9 5 6 20 9 9 7 11 4 12
Способ 1. Вычислите среднее значение строки для всех столбцов.
Следующий код показывает, как создать новый столбец в DataFrame, который отображает среднее значение строки для всех столбцов:
#define new column that shows the average row value for all columns
df[' average_all '] = df. mean (axis= 1 )
#view updated DataFrame
df
points assists rebounds average_all
0 14 5 11 10.000000
1 19 7 8 11.333333
2 9 7 10 8.666667
3 21 9 6 12.000000
4 25 12 6 14.333333
5 29 9 5 14.333333
6 20 9 9 12.666667
7 11 4 12 9.000000
Вот как интерпретировать результат:
Среднее значение первой строки рассчитывается следующим образом: (14+5+11)/3 = 10 .
Среднее значение второй строки рассчитывается следующим образом: (19+7+8)/3 = 11,33 .
И так далее.
Способ 2: вычислить среднее значение строки для определенных столбцов
Следующий код показывает, как вычислить среднее значение строки только для столбцов «очки» и «отскоки»:
#define new column that shows average of row values for points and rebounds columns
df[' avg_points_rebounds '] = df[[' points ', ' rebounds ']]. mean (axis= 1 )
#view updated DataFrame
df
points assists rebounds avg_points_rebounds
0 14 5 11 12.5
1 19 7 8 13.5
2 9 7 10 9.5
3 21 9 6 13.5
4 25 12 6 15.5
5 29 9 5 17.0
6 20 9 9 14.5
7 11 4 12 11.5
Вот как интерпретировать результат:
Среднее значение «очков» и «подборов» в первом ряду рассчитывается следующим образом: (14+11)/2 = 12,5 .
Среднее значение «очков» и «подборов» во второй строке рассчитывается следующим образом: (19+8)/2 = 13,5 .
И так далее.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в Python:
Как вычислить усеченное среднее значение в Python
Как вычислить среднее геометрическое в Python
Как заменить значения в столбце Pandas по условию