Pandalarda i̇ki sütun nasıl karşılaştırılır: örneklerle
Çoğu zaman bir Pandas DataFrame’deki iki sütunu karşılaştırmak ve karşılaştırma sonuçlarını üçüncü bir sütuna yazmak isteyebilirsiniz.
Aşağıdaki sözdizimini kullanarak bunu kolayca yapabilirsiniz:
conditions=[(condition1),(condition2)] choices=[" choice1 "," choice2 "] df[" new_column_name "]=np. select (conditions, choices, default)
İşte bu kodun yaptığı şey:
- koşullar iki sütun arasında kontrol edilecek koşullardır
- seçimler koşullara göre döndürülecek sonuçlardır
- np.select, sonuçları yeni sütunda döndürmek için kullanılır
Aşağıdaki örnekte bu kodun pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: Pandalar’daki iki sütunu karşılaştırın
İki futbol takımının beş farklı maçta attığı gol sayısını gösteren aşağıdaki DataFrame’e sahip olduğumuzu varsayalım:
import numpy as np import pandas as pd #createDataFrame df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5], ' B_points ': [4, 5, 2, 3, 2]}) #view DataFrame df A_points B_points 0 1 4 1 3 5 2 3 2 3 3 3 4 5 2
Satır başına gol sayısını karşılaştırmak ve maçın galibini üçüncü bir sütunda görüntülemek için aşağıdaki kodu kullanabiliriz:
#define conditions conditions = [df[' A_points '] > df[' B_points '], df[' A_points '] < df[' B_points ']] #define choices choices = [' A ', ' B '] #create new column in DataFrame that displays results of comparisons df[' winner '] = np. select (conditions, choices, default=' Tie ') #view the DataFrame df A_points B_points winner 0 1 4 B 1 3 5 B 2 3 2 A 3 3 3 Tie 4 5 2 A
Karşılaştırma sonuçları kazanan adı verilen yeni sütunda görüntülenir.
Yorumlar
Bir pandanın DataFrame’indeki iki sütunu karşılaştırırken akılda tutulması gereken birkaç nokta şunlardır:
- Koşulların ve seçeneklerin sayısı eşit olmalıdır.
- Varsayılan, koşullardan hiçbiri karşılanmadığında yeni sütunda görüntülenecek değeri belirtir.
- Bu kodun çalışması için NumPy ve Pandalar gereklidir.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar’da sütunlar nasıl yeniden adlandırılır?
Pandas DataFrame’e sütun nasıl eklenir
Pandas DataFrame’de sütun sırası nasıl değiştirilir?