Pandalar: iki sütunun benzersiz kombinasyonlarının nasıl sayılacağı
Bir pandas DataFrame’deki iki sütundaki benzersiz kombinasyonların sayısını saymak için aşağıdaki sözdizimini kullanabilirsiniz:
df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Pandalar’da iki sütunun benzersiz kombinasyonlarını sayma
Çeşitli basketbol oyuncularının takımını ve pozisyonunu gösteren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat', 'Heat'], ' position ': ['Guard', 'Guard', 'Guard', 'Forward', 'Guard', 'Forward', 'Forward', 'Guard']}) #view DataFrame df team position 0 Mavs Guard 1 Mavs Guard 2 Mavs Guard 3 Mavs Forward 4 Heat Guard 5 Heat Forward 6 Heat Forward 7 Heat Guard
Benzersiz takım ve konum kombinasyonlarının sayısını saymak için aşağıdaki sözdizimini kullanabiliriz:
df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ') team position count 0 Mavs Guard 3 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Forward 1
Sonuçtan şunları görebiliriz:
- Mavs-Guard kombinasyonunun 3 oluşumu vardır.
- Heat-Forward kombinasyonunun 2 oluşumu vardır.
- Heat-Guard kombinasyonunun 2 oluşumu vardır.
- Mavs-Forward kombinasyonunun 1 oluşumu vardır.
Sonuçları artan veya azalan düzende de sıralayabileceğinizi unutmayın.
Örneğin sonuçları artan sayı sırasına göre sıralamak için aşağıdaki kodu kullanabiliriz:
df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ') team position count 0 Mavs Forward 1 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Guard 3
Sonuçlar artık en küçükten en büyüğe doğru sayıya göre sıralanıyor.
Not : Pandas value_counts() işlevinin tam belgelerini burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar: GroupBy ve değer sayıları nasıl kullanılır?
Pandalar: GroupBy’yi çöp kutusu sayımı ile kullanma
Pandalar: Sayıda değer içeren bir pivot tablo nasıl oluşturulur?