Panda's: kolommen toevoegen op basis van een voorwaarde
U kunt de volgende syntaxis gebruiken om de waarden van een kolom in een pandas DataFrame op te tellen op basis van een voorwaarde:
df. loc [df[' col1 '] == some_value , ' col2 ']. sum ()
Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze syntaxis met behulp van de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5], ' rebounds ': [7, 7, 6, 9, 12, 8]}) #view DataFrame df team conference points rebounds 0 A East 11 7 1 A East 8 7 2 A East 10 6 3 B West 6 9 4 B West 6 12 5 C East 5 8
Voorbeeld 1: Voeg een kolom toe op basis van een voorwaarde
De volgende code laat zien hoe je de som van de punten kunt vinden voor rijen waarin team gelijk is aan „A“:
df. loc [df[' team '] == ' A ', ' points ']. sum () 29
Voorbeeld 2: Voeg een kolom toe op basis van meerdere voorwaarden
De volgende code laat zien hoe je de som van de punten kunt vinden voor lijnen waarbij team gelijk is aan „A“ en conferentie gelijk is aan „Oost“:
df. loc [(df[' team '] == ' A ') & (df[' conference '] == ' East '), ' points ']. sum () 29
Voorbeeld 3: Voeg een kolom toe op basis van een van verschillende voorwaarden
De volgende code laat zien hoe je de som van de punten kunt vinden voor lijnen waarbij het team gelijk is aan „A“ of „B“:
df. loc [df[' team ']. isin ([' A ',' B ']), ' dots ']. sum () 41
Meer panda-tutorials vind je op deze pagina .