Pandas: cara menghitung kombinasi unik dua kolom


Anda dapat menggunakan sintaks berikut untuk menghitung jumlah kombinasi unik di dua kolom dalam pandas DataFrame:

 df[[' col1 ', ' col2 ']]. value_counts (). reset_index (name=' count ')

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: menghitung kombinasi unik dua kolom di Pandas

Misalkan kita memiliki panda DataFrame berikut yang menunjukkan tim dan posisi berbagai pemain bola basket:

 import pandas as pd

#create dataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs',
                            'Heat', 'Heat', 'Heat', 'Heat'],
                   ' position ': ['Guard', 'Guard', 'Guard', 'Forward',
                                'Guard', 'Forward', 'Forward', 'Guard']})
#view DataFrame
df

        team position
0 Mavs Guard
1 Mavs Guard
2 Mavs Guard
3 Mavs Forward
4 Heat Guard
5 Heat Forward
6 Heat Forward
7 Heat Guard

Kita dapat menggunakan sintaks berikut untuk menghitung jumlah kombinasi tim dan posisi unik:

 df[[' team ', ' position ']]. value_counts (). reset_index (name=' count ')

        team position count
0 Mavs Guard 3
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Forward 1

Dari hasilnya kita dapat melihat:

  • Ada 3 kemunculan kombinasi Mavs-Guard.
  • Terdapat 2 kemunculan kombinasi Heat-Forward.
  • Ada 2 kemunculan kombinasi Heat-Guard.
  • Terdapat 1 kemunculan kombinasi Mavs-Forward.

Perhatikan bahwa Anda juga dapat mengurutkan hasil dalam urutan menaik atau menurun.

Misalnya, kita dapat menggunakan kode berikut untuk mengurutkan hasil dalam urutan angka:

 df[[' team ', ' position ']]. value_counts (ascending= True ). reset_index (name=' count ')

        team position count
0 Mavs Forward 1
1 Heat Forward 2
2 Heat Guard 2
3 Mavs Guard 3

Hasil sekarang diurutkan berdasarkan angka, dari yang terkecil hingga yang terbesar.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas value_counts() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara menggunakan GroupBy dan penghitungan nilai
Pandas: Cara menggunakan GroupBy dengan jumlah bin
Pandas: Cara membuat tabel pivot dengan jumlah nilai

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *