Como calcular a soma das colunas no pandas


Freqüentemente, você pode estar interessado em calcular a soma de uma ou mais colunas em um DataFrame do pandas. Felizmente, você pode fazer isso facilmente no pandas usando a função sum() .

Este tutorial mostra vários exemplos de uso desta função.

Exemplo 1: Encontre a soma de uma única coluna

Suponha que temos o seguinte DataFrame do pandas:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

	rating points assists rebounds
0 90 25 5 NaN
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7

Podemos encontrar a soma da coluna denominada “pontos” usando a seguinte sintaxe:

 df['points']. sum ()

182

A função sum() também excluirá NAs por padrão. Por exemplo, se encontrarmos a soma da coluna “rebotes”, o primeiro valor de “NaN” será simplesmente excluído do cálculo:

 df['rebounds']. sum ()

72.0

Exemplo 2: Encontre a soma de várias colunas

Podemos encontrar a soma de várias colunas usando a seguinte sintaxe:

 #find sum of points and rebounds columns
df[['rebounds', 'points']]. sum ()

rebounds 72.0
points 182.0
dtype:float64

Exemplo 3: Encontre a soma de todas as colunas

Também podemos encontrar a soma de todas as colunas usando a seguinte sintaxe:

 #find sum of all columns in DataFrame
df. sum ()

rating 853.0
points 182.0
assists 68.0
rebounds 72.0
dtype:float64

Para colunas que não são numéricas, a função sum() simplesmente não calculará a soma dessas colunas.

Você pode encontrar a documentação completa da função sum() aqui .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *