Pandas: como adicionar colunas com base em uma condição


Você pode usar a seguinte sintaxe para somar os valores de uma coluna em um DataFrame do pandas com base em uma condição:

 df. loc [df[' col1 '] == some_value , ' col2 ']. sum ()

Este tutorial fornece vários exemplos de uso prático desta sintaxe usando o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5],
                   ' rebounds ': [7, 7, 6, 9, 12, 8]})

#view DataFrame
df

        team conference points rebounds
0 A East 11 7
1 A East 8 7
2 A East 10 6
3 B West 6 9
4 B West 6 12
5 C East 5 8

Exemplo 1: Adicionar uma coluna com base em uma condição

O código a seguir mostra como encontrar a soma dos pontos das linhas onde time é igual a “A”:

 df. loc [df[' team '] == ' A ', ' points ']. sum ()

29

Exemplo 2: Adicione uma coluna com base em múltiplas condições

O código a seguir mostra como encontrar a soma dos pontos para linhas onde equipe é igual a “A” e conferência é igual a “Leste”:

 df. loc [(df[' team '] == ' A ') & (df[' conference '] == ' East '), ' points ']. sum ()

29

Exemplo 3: Adicione uma coluna com base em uma das diversas condições

O código a seguir mostra como encontrar a soma dos pontos das linhas onde o time é igual a “A” ou “B”:

 df. loc [df[' team ']. isin ([' A ',' B ']), ' dots ']. sum ()

41

Você pode encontrar mais tutoriais sobre panda nesta página .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *