Panda's: hoe u kunt controleren of er waarde in de kolom bestaat


U kunt de volgende methoden gebruiken om te controleren of een bepaalde waarde bestaat in een kolom van een pandas DataFrame:

Methode 1: Controleer of er een waarde in de kolom staat

 22 in df[' my_column ']. values

Methode 2: Controleer of er meerdere waarden in de kolom voorkomen

 df[' my_column ']. isin ([44, 45, 22]). any ()

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Voorbeeld 1: Controleer of er een waarde in de kolom staat

De volgende code laat zien hoe u kunt controleren of de waarde 22 voorkomt in de puntenkolom :

 #check if 22 exists in the 'points' column
22 in df[' points ']. values

True

De uitvoer retourneert True , wat ons vertelt dat de waarde 22 bestaat in de puntenkolom .

We kunnen dezelfde syntaxis ook gebruiken met tekenreekskolommen.

De volgende code laat bijvoorbeeld zien hoe u kunt controleren of de tekenreeks ‚J‘ voorkomt in de teamkolom :

 #check if 'J' exists in the 'team' column
'J' in df[' team ']. values

False

De uitvoer retourneert False , wat ons vertelt dat de tekenreeks „J“ niet bestaat in de kolom Team .

Voorbeeld 2: Controleer of een van meerdere waarden in de kolom bestaat

De volgende code laat zien hoe u kunt controleren of een van de waarden in de lijst [44, 45, 22] voorkomt in de puntenkolom :

 #check if 44, 45 or 22 exist in the 'points' column
df[' points ']. isin ([44, 45, 22]). any ()

True

De uitvoer retourneert True , wat ons vertelt dat ten minste één van de waarden in de lijst [44, 45, 22] voorkomt in de puntenkolom van het DataFrame.

We kunnen dezelfde syntaxis ook gebruiken met tekenreekskolommen.

De volgende code laat bijvoorbeeld zien hoe u kunt controleren of een tekenreeks uit de lijst [‚J‘, ‚K‘, ‚L‘] voorkomt in de teamkolom :

 #check if J, K, or L exists in the 'team' column
df[' team ']. isin ([' J ',' K ',' L ']). any () 
False

De uitvoer retourneert False , wat ons vertelt dat geen van de tekenreeksen in de lijst voorkomt in de teamkolom .

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert