So überprüfen sie, ob eine spalte in pandas vorhanden ist (mit beispielen)
Sie können die folgenden Methoden verwenden, um zu überprüfen, ob eine Spalte in einem Pandas-DataFrame vorhanden ist:
Methode 1: Überprüfen Sie, ob eine Spalte vorhanden ist
' column1 ' in df. columns
Dies gibt True zurück, wenn „column1“ im DataFrame vorhanden ist, andernfalls wird False zurückgegeben.
Methode 2: Überprüfen Sie, ob mehrere Spalten vorhanden sind
{' column1 ', ' column2 '}. issubset ( df.columns )
Dies gibt True zurück, wenn „column1“ und „column2“ im DataFrame vorhanden sind, andernfalls wird False zurückgegeben.
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Beispiel 1: Überprüfen Sie, ob eine Spalte vorhanden ist
Wir können den folgenden Code verwenden, um zu sehen, ob die Spalte „Team“ im DataFrame vorhanden ist:
#check if 'team' column exists in DataFrame
' team ' in df. columns
True
Die Spalte „team“ ist im DataFrame vorhanden, daher gibt pandas einen True- Wert zurück.
Wir können auch eine if- Anweisung verwenden, um eine Operation auszuführen, wenn die Spalte „team“ vorhanden ist:
#if 'team' exists, create new column called 'team_name'
if ' team ' in df. columns :
df[' team_name '] = df[' team ']
#view updated DataFrame
print (df)
team points assists rebounds team_name
0 A 18 5 11 A
1 B 22 7 8 B
2 C 19 7 10 C
3 D 14 9 6 D
4 E 14 12 6 E
5 F 11 9 5 F
6 G 20 9 9 G
7:28 a.m. 4:12 p.m.
Beispiel 2: Überprüfen Sie, ob mehrere Spalten vorhanden sind
Wir können den folgenden Code verwenden, um zu sehen, ob die Spalten „Team“ und „Spieler“ im DataFrame vorhanden sind:
#check if 'team' and 'player' columns both exist in DataFrame
{' team ', ' player '}. issubset ( df.columns )
False
Die Spalte „Team“ ist im DataFrame vorhanden, „Spieler“ jedoch nicht, sodass Pandas einen False- Wert zurückgibt.
Wir könnten auch den folgenden Code verwenden, um zu sehen, ob die „Punkte“ und „Assists“ im DataFrame vorhanden sind:
#check if 'points' and 'assists' columns both exist in DataFrame
{' points ', ' assists '}. issubset ( df.columns )
True
Da beide Spalten vorhanden sind, gibt pandas einen True- Wert zurück.
Wir können dann eine if- Anweisung verwenden, um eine Operation auszuführen, wenn die „Punkte“ und „Helfer“ vorhanden sind:
#if both exist, create new column called 'total' that finds sum of points and assists
if {' points ', ' assists '}. issubset ( df.columns ):
df[' total '] = df[' points '] + df[' assists ']
#view updated DataFrame
print (df)
team points assists rebounds total
0 A 18 5 11 23
1 B 22 7 8 29
2 C 19 7 10 26
3 D 14 9 6 23
4 E 14 12 6 26
5 F 11 9 5 20
6 G 20 9 9 29
7:28 4 12 32
Da im DataFrame sowohl „Punkte“ als auch „Unterstützungen“ vorhanden sind, hat Pandas eine neue Spalte mit dem Namen „Gesamt“ erstellt, die die Summe der Spalten „Punkte“ und „Unterstützungen“ anzeigt.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So behalten Sie bestimmte Spalten in Pandas bei
So wählen Sie Spalten nach Index in Pandas aus
So verschieben Sie eine Spalte in Pandas