Panda's: kolommen in twee verschillende dataframes vergelijken
U kunt de volgende methoden gebruiken om kolommen uit twee verschillende Panda DataFrames te vergelijken:
Methode 1: Tel overeenkomende waarden tussen kolommen
df1[' my_column ']. isin (df2[' my_column ']). value_counts ()
Methode 2: Toon overeenkomende waarden tussen kolommen
p.d. merge (df1, df2, on=[' my_column '], how=' inner ')
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrames:
import numpy as np import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' team ': ['Mavs', 'Rockets', 'Spurs', 'Heat', 'Nets'], ' points ': [22, 30, 15, 17, 14]}) #view DataFrame print (df1) team points 0 Mavs 22 1 Rockets 30 2 Spurs 15 3 Heat 17 4 Nets 14 #create second DataFrame df2 = pd. DataFrame ({' team ': ['Mavs', 'Thunder', 'Spurs', 'Nets', 'Cavs'], ' points ': [25, 40, 31, 32, 22]}) #view DataFrame print (df2) team points 0 Mavs 25 1 Thunder 40 2 Spurs 31 3 Nets 32 4 Cavs 22
Voorbeeld 1: Tel overeenkomende waarden tussen kolommen
De volgende code laat zien hoe u het aantal overeenkomende waarden tussen teamkolommen in elk DataFrame kunt tellen:
#count matching values in team columns
df1[' team ']. isin (df2[' team ']). value_counts ()
True 3
False 2
Name: team, dtype: int64
We zien dat de twee DataFrames drie teamnamen gemeen hebben en twee verschillende teamnamen.
Voorbeeld 2: Toon overeenkomende waarden tussen kolommen
De volgende code laat zien hoe u de werkelijke overeenkomende waarden tussen teamkolommen in elk DataFrame kunt weergeven:
#display matching values between team columns
p.d. merge (df1, df2, on=[' team '], how=' inner ')
team points_x points_y
0 Mavs 22 25
1 Spurs 15 31
2 Nets 14 32
Uit het resultaat kunnen we zien dat beide DataFrames de volgende waarden gemeen hebben in de teamkolommen :
- Mav
- Sporen
- Netten
Gerelateerd: Een Inner Join uitvoeren in Panda’s (met voorbeeld)
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Hoe kolommen te hernoemen in Pandas
Hoe u een kolom toevoegt aan een Pandas DataFrame
Hoe u de kolomvolgorde in Pandas DataFrame kunt wijzigen