Pandas: cara membandingkan kolom dalam dua dataframes yang berbeda


Anda dapat menggunakan metode berikut untuk membandingkan kolom dari dua DataFrame panda yang berbeda:

Metode 1: Hitung nilai yang cocok antar kolom

 df1[' my_column ']. isin (df2[' my_column ']). value_counts ()

Metode 2: Tampilkan nilai yang cocok antar kolom

 p.d. merge (df1, df2, on=[' my_column '], how=' inner ')

Contoh berikut menunjukkan cara menggunakan setiap metode dengan DataFrame panda berikut:

 import numpy as np
import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['Mavs', 'Rockets', 'Spurs', 'Heat', 'Nets'],
                    ' points ': [22, 30, 15, 17, 14]})

#view DataFrame
print (df1)

      team points
0 Mavs 22
1 Rockets 30
2 Spurs 15
3 Heat 17
4 Nets 14

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['Mavs', 'Thunder', 'Spurs', 'Nets', 'Cavs'],
                    ' points ': [25, 40, 31, 32, 22]})

#view DataFrame
print (df2)

      team points
0 Mavs 25
1 Thunder 40
2 Spurs 31
3 Nets 32
4 Cavs 22

Contoh 1: Hitung nilai yang cocok antar kolom

Kode berikut menunjukkan cara menghitung jumlah nilai yang cocok antar kolom tim di setiap DataFrame:

 #count matching values in team columns
df1[' team ']. isin (df2[' team ']). value_counts ()

True 3
False 2
Name: team, dtype: int64

Kita melihat kedua DataFrame memiliki 3 nama tim yang sama dan 2 nama tim berbeda.

Contoh 2: Menampilkan nilai yang cocok antar kolom

Kode berikut menunjukkan cara menampilkan nilai pencocokan aktual antar kolom tim di setiap DataFrame:

 #display matching values between team columns
p.d. merge (df1, df2, on=[' team '], how=' inner ')

	team points_x points_y
0 Mavs 22 25
1 Spurs 15 31
2 Nets 14 32

Dari hasilnya, kita dapat melihat bahwa kedua DataFrame memiliki kesamaan nilai berikut di kolom tim :

  • Mav
  • Kemasyhuran
  • Jaring

Terkait: Cara Melakukan Inner Join di Pandas (Dengan Contoh)

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara mengganti nama kolom di Pandas
Bagaimana cara menambahkan kolom ke Pandas DataFrame
Bagaimana mengubah urutan kolom di Pandas DataFrame

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *