Pandas: so fügen sie spalten basierend auf einer bedingung hinzu
Sie können die folgende Syntax verwenden, um die Werte einer Spalte in einem Pandas-DataFrame basierend auf einer Bedingung zu summieren:
df. loc [df[' col1 '] == some_value , ' col2 ']. sum ()
Dieses Tutorial bietet mehrere Beispiele für die praktische Verwendung dieser Syntax unter Verwendung des folgenden Pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5], ' rebounds ': [7, 7, 6, 9, 12, 8]}) #view DataFrame df team conference points rebounds 0 A East 11 7 1 A East 8 7 2 A East 10 6 3 B West 6 9 4 B West 6 12 5 C East 5 8
Beispiel 1: Fügen Sie eine Spalte basierend auf einer Bedingung hinzu
Der folgende Code zeigt, wie man die Summe der Punkte für Zeilen ermittelt, in denen Team gleich „A“ ist:
df. loc [df[' team '] == ' A ', ' points ']. sum () 29
Beispiel 2: Fügen Sie eine Spalte basierend auf mehreren Bedingungen hinzu
Der folgende Code zeigt, wie man die Summe der Punkte für Linien ermittelt, bei denen Team gleich „A“ und Konferenz gleich „Ost“ ist:
df. loc [(df[' team '] == ' A ') & (df[' conference '] == ' East '), ' points ']. sum () 29
Beispiel 3: Fügen Sie eine Spalte basierend auf einer von mehreren Bedingungen hinzu
Der folgende Code zeigt, wie man die Summe der Punkte für Linien ermittelt, bei denen das Team gleich „A“ oder „B“ ist:
df. loc [df[' team ']. isin ([' A ',' B ']), ' dots ']. sum () 41
Weitere Panda-Tutorials finden Sie auf dieser Seite .