如何计算 pandas 中选定列的平均值
您可以使用以下方法来计算 pandas DataFrame 中选定列的平均行值:
方法 1:计算所有列的平均行值
df. mean (axis= 1 )
方法 2:计算特定列的平均行值
df[[' col1 ', ' col3 ']]. mean (axis= 1 )
以下示例展示了如何在实践中使用以下 pandas DataFrame 的每种方法:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [14, 19, 9, 21, 25, 29, 20, 11], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df points assists rebounds 0 14 5 11 1 19 7 8 2 9 7 10 3 21 9 6 4 25 12 6 5 29 9 5 6 20 9 9 7 11 4 12
方法 1:计算所有列的平均行值
以下代码演示了如何在 DataFrame 中创建一个新列,以显示所有列的平均行值:
#define new column that shows the average row value for all columns
df[' average_all '] = df. mean (axis= 1 )
#view updated DataFrame
df
points assists rebounds average_all
0 14 5 11 10.000000
1 19 7 8 11.333333
2 9 7 10 8.666667
3 21 9 6 12.000000
4 25 12 6 14.333333
5 29 9 5 14.333333
6 20 9 9 12.666667
7 11 4 12 9.000000
以下是如何解释结果:
第一行的平均值计算如下: (14+5+11) / 3 = 10 。
第二行的平均值计算如下: (19+7+8) / 3 = 11.33 。
等等。
方法 2:计算特定列的平均行值
以下代码显示如何仅计算“得分”和“篮板”列的平均行值:
#define new column that shows average of row values for points and rebounds columns
df[' avg_points_rebounds '] = df[[' points ', ' rebounds ']]. mean (axis= 1 )
#view updated DataFrame
df
points assists rebounds avg_points_rebounds
0 14 5 11 12.5
1 19 7 8 13.5
2 9 7 10 9.5
3 21 9 6 13.5
4 25 12 6 15.5
5 29 9 5 17.0
6 20 9 9 14.5
7 11 4 12 11.5
以下是如何解释结果:
第一行“得分”和“篮板”的平均值计算如下:(14+11) /2=12.5 。
第二行“得分”和“篮板”的平均值计算如下:(19+8) /2=13.5 。
等等。
其他资源
以下教程解释了如何在 Python 中执行其他常见操作: