Pandas: cara menghitung kombinasi unik dua kolom
Anda dapat menggunakan sintaks berikut untuk menghitung jumlah kombinasi unik di dua kolom dalam pandas DataFrame:
df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: menghitung kombinasi unik dua kolom di Pandas
Misalkan kita memiliki panda DataFrame berikut yang menunjukkan tim dan posisi berbagai pemain bola basket:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat', 'Heat'], ' position ': ['Guard', 'Guard', 'Guard', 'Forward', 'Guard', 'Forward', 'Forward', 'Guard']}) #view DataFrame df team position 0 Mavs Guard 1 Mavs Guard 2 Mavs Guard 3 Mavs Forward 4 Heat Guard 5 Heat Forward 6 Heat Forward 7 Heat Guard
Kita dapat menggunakan sintaks berikut untuk menghitung jumlah kombinasi tim dan posisi unik:
df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ') team position count 0 Mavs Guard 3 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Forward 1
Dari hasilnya kita dapat melihat:
- Ada 3 kemunculan kombinasi Mavs-Guard.
- Terdapat 2 kemunculan kombinasi Heat-Forward.
- Ada 2 kemunculan kombinasi Heat-Guard.
- Terdapat 1 kemunculan kombinasi Mavs-Forward.
Perhatikan bahwa Anda juga dapat mengurutkan hasil dalam urutan menaik atau menurun.
Misalnya, kita dapat menggunakan kode berikut untuk mengurutkan hasil dalam urutan angka:
df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ') team position count 0 Mavs Forward 1 1 Heat Forward 2 2 Heat Guard 2 3 Mavs Guard 3
Hasil sekarang diurutkan berdasarkan angka, dari yang terkecil hingga yang terbesar.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas value_counts() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: Cara menggunakan GroupBy dan penghitungan nilai
Pandas: Cara menggunakan GroupBy dengan jumlah bin
Pandas: Cara membuat tabel pivot dengan jumlah nilai