Pandasで列の合計を計算する方法

によるベンジャミン・アンダーソン博士 7月 28, 2023 ガイド 0コメント

多くの場合、pandas DataFrame 内の 1 つ以上の列の合計を計算することに興味があるかもしれません。幸いなことに、パンダではsum()関数を使用してこれを簡単に行うことができます。

このチュートリアルでは、この関数の使用例をいくつか示します。

例 1: 単一列の合計を求める

次のパンダデータフレームがあるとします。

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

	rating points assists rebounds
0 90 25 5 NaN
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7

次の構文を使用して、「ポイント」というラベルの付いた列の合計を見つけることができます。

 df['points']. sum ()

182

sum() 関数はデフォルトで NA も除外します。たとえば、「リバウンド」列の合計を求める場合、「NaN」の最初の値は単純に計算から除外されます。

 df['rebounds']. sum ()

72.0

例 2: 複数の列の合計を求める

次の構文を使用して、複数の列の合計を見つけることができます。

 #find sum of points and rebounds columns
df[['rebounds', 'points']]. sum ()

rebounds 72.0
points 182.0
dtype:float64

例 3: すべての列の合計を求める

次の構文を使用して、すべての列の合計を見つけることもできます。

 #find sum of all columns in DataFrame
df. sum ()

rating 853.0
points 182.0
assists 68.0
rebounds 72.0
dtype:float64

数値ではない列の場合、 sum() 関数は単にそれらの列の合計を計算しません。

sum() 関数の完全なドキュメントはここで見つけることができます。

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る

例 1: 単一列の合計を求める

例 2: 複数の列の合計を求める

例 3: すべての列の合計を求める

著者について

ベンジャミン・アンダーソン博士

コメントを追加する