Controleren of er een kolom bestaat in panda's (met voorbeelden)


U kunt de volgende methoden gebruiken om te controleren of er een kolom bestaat in een Pandas DataFrame:

Methode 1: Controleer of er een kolom bestaat

 ' column1 ' in df. columns

Dit retourneert True als „column1“ bestaat in het DataFrame, anders retourneert het False .

Methode 2: Controleer of er meerdere kolommen zijn

 {' column1 ', ' column2 '}. issubset ( df.columns )

Dit retourneert True als „column1“ en „column2“ bestaan in het DataFrame, anders wordt False geretourneerd.

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Voorbeeld 1: Controleer of een kolom bestaat

We kunnen de volgende code gebruiken om te zien of de kolom ‚team‘ bestaat in het DataFrame:

 #check if 'team' column exists in DataFrame
' team ' in df. columns

True

De kolom ‚team‘ bestaat in het DataFrame, dus panda’s retourneren een True- waarde.

We kunnen ook een if- instructie gebruiken om een bewerking uit te voeren als de kolom „team“ bestaat:

 #if 'team' exists, create new column called 'team_name'
if ' team ' in df. columns :
    df[' team_name '] = df[' team ']
    
#view updated DataFrame
print (df)

  team points assists rebounds team_name
0 A 18 5 11 A
1 B 22 7 8 B
2 C 19 7 10 C
3 D 14 9 6 D
4 E 14 12 6 E
5 F 11 9 5 F
6 G 20 9 9 G
7:28 a.m. 4:12 p.m.

Voorbeeld 2: Controleer of er meerdere kolommen zijn

We kunnen de volgende code gebruiken om te zien of de kolommen ‚team‘ en ’speler‘ bestaan in het DataFrame:

 #check if 'team' and 'player' columns both exist in DataFrame
{' team ', ' player '}. issubset ( df.columns )

False

De kolom ‚team‘ bestaat in het DataFrame, maar ’speler‘ niet, dus panda’s retourneren een False- waarde.

We kunnen ook de volgende code gebruiken om te zien of de „punten“ en „assisten“ bestaan in het DataFrame:

 #check if 'points' and 'assists' columns both exist in DataFrame
{' points ', ' assists '}. issubset ( df.columns )

True

Beide kolommen bestaan, dus panda’s retourneren de waarde True .

We kunnen dan een if- instructie gebruiken om een bewerking uit te voeren als de „punten“ en „helpers“ bestaan:

 #if both exist, create new column called 'total' that finds sum of points and assists
if {' points ', ' assists '}. issubset ( df.columns ):
    df[' total '] = df[' points '] + df[' assists ']
    
#view updated DataFrame
print (df)

     team points assists rebounds total
0 A 18 5 11 23
1 B 22 7 8 29
2 C 19 7 10 26
3 D 14 9 6 23
4 E 14 12 6 26
5 F 11 9 5 20
6 G 20 9 9 29
7:28 4 12 32

Omdat zowel „punten“ als „assisten“ in het DataFrame voorkomen, hebben Panda’s een nieuwe kolom gemaakt met de naam „totaal“, die de som van de kolommen „punten“ en „assisten“ toont.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe bepaalde kolommen in Panda’s te behouden
Hoe u kolommen op index selecteert in Pandas
Hoe een kolom in Panda’s te verplaatsen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert