Panda's: hoe controleer je of meerdere kolommen gelijk zijn?


U kunt de volgende methoden gebruiken om te controleren of meerdere kolommen gelijk zijn in panda’s:

Methode 1: Controleer of alle kolommen gelijk zijn

 df[' matching '] = df. eq (df. iloc [:, 0], axis= 0 ). all (1)

Methode 2: Controleer of specifieke kolommen gelijk zijn

 df[' matching '] = df. apply ( lambda x: x.col1 == x.col3 == x.col4 , axis= 1 )

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [4, 0, 3, 3, 6, 8, 7],
                   ' B ': [4, 2, 3, 5, 6, 4, 7],
                   ' C ': [4, 0, 3, 3, 5, 10, 7],
                   ' D ': [4, 0, 3, 3, 3, 8, 7]})

#view DataFrame
print (df)

   ABCD
0 4 4 4 4
1 0 2 0 0
2 3 3 3 3
3 3 5 3 3
4 6 6 5 3
5 8 4 10 8
6 7 7 7 7

Voorbeeld 1: Controleer of alle kolommen gelijk zijn

We kunnen de volgende syntaxis gebruiken om te controleren of de waarde van elke kolom in het DataFrame voor elke rij gelijk is:

 #create new column that checks if all columns match in each row
df[' matching '] = df. eq (df. iloc [:, 0], axis= 0 ). all (1)

#view updated DataFrame
print (df)

   ABCD matching
0 4 4 4 4 True
1 0 2 0 0 False
2 3 3 3 3 True
3 3 5 3 3 False
4 6 6 5 3 False
5 8 4 10 8 False
6 7 7 7 7 True

Als de waarde van elke kolom gelijk is, retourneert de overeenkomstige kolom True .

Anders retourneert het False .

Merk op dat u True en False- waarden als volgt kunt converteren naar 1 en 0 met astype(int) :

 #create new column that checks if all columns match in each row
df[' matching '] = df. eq (df. iloc [:, 0], axis= 0 ). all (1). astype (int)

#view updated DataFrame
print (df)

   ABCD matching
0 4 4 4 4 1
1 0 2 0 0 0
2 3 3 3 3 1
3 3 5 3 3 0
4 6 6 5 3 0
5 8 4 10 8 0
6 7 7 7 7 1

Voorbeeld 2: Controleer of specifieke kolommen gelijk zijn

We kunnen de volgende syntaxis gebruiken om te controleren of de waarden in de kolommen A, C en D van het DataFrame voor elke rij gelijk zijn:

 #create new column that checks if values in columns A, C, and D are equal
df[' matching '] = df. apply ( lambda x: x. A == x. C == x. D , axis= 1 )

#view updated DataFrame
print (df)

   ABCD matching
0 4 4 4 4 True
1 0 2 0 0 True
2 3 3 3 3 True
3 3 5 3 3 True
4 6 6 5 3 False
5 8 4 10 8 False
6 7 7 7 7 True

Als de waarden in de kolommen A, C en D gelijk zijn, retourneert de overeenkomstige kolom True .

Anders retourneert het False .

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe kolommen te hernoemen in Pandas
Hoe u een kolom toevoegt aan een Pandas DataFrame
Hoe u de kolomvolgorde in Pandas DataFrame kunt wijzigen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert