Cara membandingkan dua kolom di pandas: dengan contoh
Seringkali Anda mungkin ingin membandingkan dua kolom dalam Pandas DataFrame dan menulis hasil perbandingan ke kolom ketiga.
Anda dapat dengan mudah melakukan ini menggunakan sintaks berikut:
conditions=[(condition1),(condition2)] choices=[" choice1 "," choice2 "] df[" new_column_name "]=np. select (conditions, choices, default)
Inilah yang dilakukan kode ini:
- condition adalah kondisi yang harus diperiksa antara dua kolom
- pilihan adalah hasil yang dikembalikan berdasarkan kondisi
- np.select digunakan untuk mengembalikan hasil di kolom baru
Contoh berikut menunjukkan cara menggunakan kode ini dalam praktik.
Contoh: Bandingkan dua kolom di Pandas
Misalkan kita memiliki DataFrame berikut yang menunjukkan jumlah gol yang dicetak oleh dua tim sepak bola dalam lima pertandingan berbeda:
import numpy as np import pandas as pd #createDataFrame df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5], ' B_points ': [4, 5, 2, 3, 2]}) #view DataFrame df A_points B_points 0 1 4 1 3 5 2 3 2 3 3 3 4 5 2
Kita dapat menggunakan kode berikut untuk membandingkan jumlah gol per baris dan menampilkan pemenang pertandingan di kolom ketiga:
#define conditions conditions = [df[' A_points '] > df[' B_points '], df[' A_points '] < df[' B_points ']] #define choices choices = [' A ', ' B '] #create new column in DataFrame that displays results of comparisons df[' winner '] = np. select (conditions, choices, default=' Tie ') #view the DataFrame df A_points B_points winner 0 1 4 B 1 3 5 B 2 3 2 A 3 3 3 Tie 4 5 2 A
Hasil perbandingannya ditampilkan pada kolom baru bernama Winner .
Komentar
Berikut beberapa hal yang perlu diingat saat membandingkan dua kolom di pandas DataFrame:
- Jumlah kondisi dan pilihan harus sama.
- Defaultnya menentukan nilai yang akan ditampilkan di kolom baru jika tidak ada kondisi yang terpenuhi.
- NumPy dan Pandas diperlukan agar kode ini berfungsi.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Cara mengganti nama kolom di Pandas
Bagaimana cara menambahkan kolom ke Pandas DataFrame
Bagaimana mengubah urutan kolom di Pandas DataFrame