Cara membandingkan dua kolom di pandas: dengan contoh


Seringkali Anda mungkin ingin membandingkan dua kolom dalam Pandas DataFrame dan menulis hasil perbandingan ke kolom ketiga.

Anda dapat dengan mudah melakukan ini menggunakan sintaks berikut:

 conditions=[(condition1),(condition2)]
choices=[" choice1 "," choice2 "]

df[" new_column_name "]=np. select (conditions, choices, default)

Inilah yang dilakukan kode ini:

  • condition adalah kondisi yang harus diperiksa antara dua kolom
  • pilihan adalah hasil yang dikembalikan berdasarkan kondisi
  • np.select digunakan untuk mengembalikan hasil di kolom baru

Contoh berikut menunjukkan cara menggunakan kode ini dalam praktik.

Contoh: Bandingkan dua kolom di Pandas

Misalkan kita memiliki DataFrame berikut yang menunjukkan jumlah gol yang dicetak oleh dua tim sepak bola dalam lima pertandingan berbeda:

 import numpy as np
import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5],
                   ' B_points ': [4, 5, 2, 3, 2]})
             
#view DataFrame      
df

          A_points B_points
0 1 4
1 3 5
2 3 2
3 3 3
4 5 2

Kita dapat menggunakan kode berikut untuk membandingkan jumlah gol per baris dan menampilkan pemenang pertandingan di kolom ketiga:

 #define conditions
conditions = [df[' A_points '] > df[' B_points '], 
              df[' A_points '] < df[' B_points ']]

#define choices
choices = [' A ', ' B ']

#create new column in DataFrame that displays results of comparisons
df[' winner '] = np. select (conditions, choices, default=' Tie ')

#view the DataFrame
df

          A_points B_points winner
0 1 4 B
1 3 5 B
2 3 2 A
3 3 3 Tie
4 5 2 A

Hasil perbandingannya ditampilkan pada kolom baru bernama Winner .

Komentar

Berikut beberapa hal yang perlu diingat saat membandingkan dua kolom di pandas DataFrame:

  • Jumlah kondisi dan pilihan harus sama.
  • Defaultnya menentukan nilai yang akan ditampilkan di kolom baru jika tidak ada kondisi yang terpenuhi.
  • NumPy dan Pandas diperlukan agar kode ini berfungsi.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara mengganti nama kolom di Pandas
Bagaimana cara menambahkan kolom ke Pandas DataFrame
Bagaimana mengubah urutan kolom di Pandas DataFrame

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *