Pandas: so fügen sie spalten basierend auf einer bedingung hinzu


Sie können die folgende Syntax verwenden, um die Werte einer Spalte in einem Pandas-DataFrame basierend auf einer Bedingung zu summieren:

 df. loc [df[' col1 '] == some_value , ' col2 ']. sum ()

Dieses Tutorial bietet mehrere Beispiele für die praktische Verwendung dieser Syntax unter Verwendung des folgenden Pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5],
                   ' rebounds ': [7, 7, 6, 9, 12, 8]})

#view DataFrame
df

        team conference points rebounds
0 A East 11 7
1 A East 8 7
2 A East 10 6
3 B West 6 9
4 B West 6 12
5 C East 5 8

Beispiel 1: Fügen Sie eine Spalte basierend auf einer Bedingung hinzu

Der folgende Code zeigt, wie man die Summe der Punkte für Zeilen ermittelt, in denen Team gleich „A“ ist:

 df. loc [df[' team '] == ' A ', ' points ']. sum ()

29

Beispiel 2: Fügen Sie eine Spalte basierend auf mehreren Bedingungen hinzu

Der folgende Code zeigt, wie man die Summe der Punkte für Linien ermittelt, bei denen Team gleich „A“ und Konferenz gleich „Ost“ ist:

 df. loc [(df[' team '] == ' A ') & (df[' conference '] == ' East '), ' points ']. sum ()

29

Beispiel 3: Fügen Sie eine Spalte basierend auf einer von mehreren Bedingungen hinzu

Der folgende Code zeigt, wie man die Summe der Punkte für Linien ermittelt, bei denen das Team gleich „A“ oder „B“ ist:

 df. loc [df[' team ']. isin ([' A ',' B ']), ' dots ']. sum ()

41

Weitere Panda-Tutorials finden Sie auf dieser Seite .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert