Pandasで列の合計を計算する方法
多くの場合、pandas DataFrame 内の 1 つ以上の列の合計を計算することに興味があるかもしれません。幸いなことに、パンダではsum()関数を使用してこれを簡単に行うことができます。
このチュートリアルでは、この関数の使用例をいくつか示します。
例 1: 単一列の合計を求める
次のパンダ データフレームがあるとします。
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
次の構文を使用して、「ポイント」というラベルの付いた列の合計を見つけることができます。
df['points']. sum ()
182
sum() 関数はデフォルトで NA も除外します。たとえば、「リバウンド」列の合計を求める場合、「NaN」の最初の値は単純に計算から除外されます。
df['rebounds']. sum ()
72.0
例 2: 複数の列の合計を求める
次の構文を使用して、複数の列の合計を見つけることができます。
#find sum of points and rebounds columns df[['rebounds', 'points']]. sum () rebounds 72.0 points 182.0 dtype:float64
例 3: すべての列の合計を求める
次の構文を使用して、すべての列の合計を見つけることもできます。
#find sum of all columns in DataFrame df. sum () rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype:float64
数値ではない列の場合、 sum() 関数は単にそれらの列の合計を計算しません。
sum() 関数の完全なドキュメントはここで見つけることができます。