Як обчислити суму стовпців у pandas
Часто вам може бути цікаво обчислити суму одного або кількох стовпців у pandas DataFrame. На щастя, ви можете легко зробити це в pandas за допомогою функції sum() .
Цей підручник показує кілька прикладів використання цієї функції.
Приклад 1: Знайдіть суму в одному стовпці
Припустімо, що у нас є наступні pandas DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
Ми можемо знайти суму стовпця з позначкою «бали», використовуючи такий синтаксис:
df['points']. sum ()
182
Функція sum() також виключає NA за замовчуванням. Наприклад, якщо ми знайдемо суму стовпця «підбирання», перше значення «NaN» буде просто виключено з розрахунку:
df['rebounds']. sum ()
72.0
Приклад 2: Знайдіть суму кількох стовпців
Ми можемо знайти суму кількох стовпців за допомогою такого синтаксису:
#find sum of points and rebounds columns df[['rebounds', 'points']]. sum () rebounds 72.0 points 182.0 dtype:float64
Приклад 3: Знайдіть суму всіх стовпців
Ми також можемо знайти суму всіх стовпців за допомогою такого синтаксису:
#find sum of all columns in DataFrame df. sum () rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype:float64
Для стовпців, які не є числовими, функція sum() просто не обчислить суму цих стовпців.
Ви можете знайти повну документацію функції sum() тут .