如何计算 pandas 中列的平均值


通常,您可能对计算 pandas DataFrame 中一列或多列的平均值感兴趣。幸运的是,您可以使用Mean()函数在 pandas 中轻松完成此操作。

本教程展示了使用此功能的几个示例。

示例 1:求单列的平均值

假设我们有以下 pandas DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

我们可以使用以下语法找到标记为“点”的列的平均值:

 df['points']. mean ()

18.2

默认情况下,Mean() 函数还将排除 NA。例如,如果我们找到“篮板”列的平均值,则第一个值“NaN”将被排除在计算之外:

 df['rebounds']. mean ()

8.0

如果您尝试查找非数字列的平均值,您将收到错误:

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

示例 2:求多列的平均值

我们可以使用以下语法找到多列的平均值:

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

示例 3:求所有列的平均值

我们还可以使用以下语法找到所有数字列的平均值:

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

请注意,Mean() 函数将简单地忽略非数字列。

其他资源

如何计算 pandas 的中位数
如何计算 Pandas 中的列总和
如何找到 Pandas 中列的最大值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注