Panda's: kolommen toevoegen op basis van een voorwaarde


U kunt de volgende syntaxis gebruiken om de waarden van een kolom in een pandas DataFrame op te tellen op basis van een voorwaarde:

 df. loc [df[' col1 '] == some_value , ' col2 ']. sum ()

Deze tutorial biedt verschillende voorbeelden van praktisch gebruik van deze syntaxis met behulp van de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5],
                   ' rebounds ': [7, 7, 6, 9, 12, 8]})

#view DataFrame
df

        team conference points rebounds
0 A East 11 7
1 A East 8 7
2 A East 10 6
3 B West 6 9
4 B West 6 12
5 C East 5 8

Voorbeeld 1: Voeg een kolom toe op basis van een voorwaarde

De volgende code laat zien hoe je de som van de punten kunt vinden voor rijen waarin team gelijk is aan „A“:

 df. loc [df[' team '] == ' A ', ' points ']. sum ()

29

Voorbeeld 2: Voeg een kolom toe op basis van meerdere voorwaarden

De volgende code laat zien hoe je de som van de punten kunt vinden voor lijnen waarbij team gelijk is aan „A“ en conferentie gelijk is aan „Oost“:

 df. loc [(df[' team '] == ' A ') & (df[' conference '] == ' East '), ' points ']. sum ()

29

Voorbeeld 3: Voeg een kolom toe op basis van een van verschillende voorwaarden

De volgende code laat zien hoe je de som van de punten kunt vinden voor lijnen waarbij het team gelijk is aan „A“ of „B“:

 df. loc [df[' team ']. isin ([' A ',' B ']), ' dots ']. sum ()

41

Meer panda-tutorials vind je op deze pagina .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert