Controleren of er een kolom bestaat in panda's (met voorbeelden)
U kunt de volgende methoden gebruiken om te controleren of er een kolom bestaat in een Pandas DataFrame:
Methode 1: Controleer of er een kolom bestaat
' column1 ' in df. columns
Dit retourneert True als „column1“ bestaat in het DataFrame, anders retourneert het False .
Methode 2: Controleer of er meerdere kolommen zijn
{' column1 ', ' column2 '}. issubset ( df.columns )
Dit retourneert True als „column1“ en „column2“ bestaan in het DataFrame, anders wordt False geretourneerd.
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Voorbeeld 1: Controleer of een kolom bestaat
We kunnen de volgende code gebruiken om te zien of de kolom ‚team‘ bestaat in het DataFrame:
#check if 'team' column exists in DataFrame
' team ' in df. columns
True
De kolom ‚team‘ bestaat in het DataFrame, dus panda’s retourneren een True- waarde.
We kunnen ook een if- instructie gebruiken om een bewerking uit te voeren als de kolom „team“ bestaat:
#if 'team' exists, create new column called 'team_name'
if ' team ' in df. columns :
df[' team_name '] = df[' team ']
#view updated DataFrame
print (df)
team points assists rebounds team_name
0 A 18 5 11 A
1 B 22 7 8 B
2 C 19 7 10 C
3 D 14 9 6 D
4 E 14 12 6 E
5 F 11 9 5 F
6 G 20 9 9 G
7:28 a.m. 4:12 p.m.
Voorbeeld 2: Controleer of er meerdere kolommen zijn
We kunnen de volgende code gebruiken om te zien of de kolommen ‚team‘ en ’speler‘ bestaan in het DataFrame:
#check if 'team' and 'player' columns both exist in DataFrame
{' team ', ' player '}. issubset ( df.columns )
False
De kolom ‚team‘ bestaat in het DataFrame, maar ’speler‘ niet, dus panda’s retourneren een False- waarde.
We kunnen ook de volgende code gebruiken om te zien of de „punten“ en „assisten“ bestaan in het DataFrame:
#check if 'points' and 'assists' columns both exist in DataFrame
{' points ', ' assists '}. issubset ( df.columns )
True
Beide kolommen bestaan, dus panda’s retourneren de waarde True .
We kunnen dan een if- instructie gebruiken om een bewerking uit te voeren als de „punten“ en „helpers“ bestaan:
#if both exist, create new column called 'total' that finds sum of points and assists
if {' points ', ' assists '}. issubset ( df.columns ):
df[' total '] = df[' points '] + df[' assists ']
#view updated DataFrame
print (df)
team points assists rebounds total
0 A 18 5 11 23
1 B 22 7 8 29
2 C 19 7 10 26
3 D 14 9 6 23
4 E 14 12 6 26
5 F 11 9 5 20
6 G 20 9 9 29
7:28 4 12 32
Omdat zowel „punten“ als „assisten“ in het DataFrame voorkomen, hebben Panda’s een nieuwe kolom gemaakt met de naam „totaal“, die de som van de kolommen „punten“ en „assisten“ toont.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe bepaalde kolommen in Panda’s te behouden
Hoe u kolommen op index selecteert in Pandas
Hoe een kolom in Panda’s te verplaatsen