Pandas で選択した列の平均を計算する方法


次のメソッドを使用して、pandas DataFrame で選択した列の平均行値を計算できます。

方法 1: すべての列の行の平均値を計算する

 df. mean (axis= 1 )

方法 2: 特定の列の行の平均値を計算する

 df[[' col1 ', ' col3 ']]. mean (axis= 1 )

次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [14, 19, 9, 21, 25, 29, 20, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	points assists rebounds
0 14 5 11
1 19 7 8
2 9 7 10
3 21 9 6
4 25 12 6
5 29 9 5
6 20 9 9
7 11 4 12

方法 1: すべての列の行の平均値を計算する

次のコードは、すべての列の平均行値を表示する新しい列を DataFrame に作成する方法を示しています。

 #define new column that shows the average row value for all columns
df[' average_all '] = df. mean (axis= 1 )

#view updated DataFrame
df

	points assists rebounds average_all
0 14 5 11 10.000000
1 19 7 8 11.333333
2 9 7 10 8.666667
3 21 9 6 12.000000
4 25 12 6 14.333333
5 29 9 5 14.333333
6 20 9 9 12.666667
7 11 4 12 9.000000

結果を解釈する方法は次のとおりです。

最初の行の平均値は次のように計算されます: (14+5+11) / 3 = 10

2 行目の平均値は次のように計算されます: (19+7+8) / 3 = 11.33

等々。

方法 2: 特定の列の行の平均値を計算する

次のコードは、「points」列と「rebounds」列のみの行の平均値を計算する方法を示しています。

 #define new column that shows average of row values for points and rebounds columns
df[' avg_points_rebounds '] = df[[' points ', ' rebounds ']]. mean (axis= 1 )

#view updated DataFrame
df

        points assists rebounds avg_points_rebounds
0 14 5 11 12.5
1 19 7 8 13.5
2 9 7 10 9.5
3 21 9 6 13.5
4 25 12 6 15.5
5 29 9 5 17.0
6 20 9 9 14.5
7 11 4 12 11.5

結果を解釈する方法は次のとおりです。

最初の行の「ポイント」と「リバウンド」の平均値は、次のように計算されます: (14+11) / 2 = 12.5

2行目の「ポイント」と「リバウンド」の平均値は、(19+8) / 2 = 13.5で計算されます。

等々。

追加リソース

次のチュートリアルでは、Python で他の一般的な操作を実行する方法について説明します。

Python でトリミング平均を計算する方法
Python で幾何平均を計算する方法
Pandas列の値を条件に基づいて置き換える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です