Pandas: membuat tabel frekuensi berdasarkan beberapa kolom


Anda dapat menggunakan sintaks dasar berikut untuk membuat tabel frekuensi di panda berdasarkan beberapa kolom:

 df. value_counts ([' column1 ',' column2 '])

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Buat tabel frekuensi di Pandas berdasarkan beberapa kolom

Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang nama tim, posisi, dan poin yang dicetak oleh berbagai pemain bola basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [24, 33, 20, 15, 16, 16, 29, 25]})

#view DataFrame
print (df)

  team position points
0 AG 24
1 AG 33
2 AG 20
3 AF15
4 BG 16
5 BG 16
6 BF 29
7 BF 25

Kita dapat menggunakan fungsi value_counts() untuk membuat tabel frekuensi yang menunjukkan kemunculan setiap kombinasi nilai dalam kolom tim dan posisi :

 #count frequency of values in team and position columns
df. value_counts ([' team ',' position '])

team position
GA 3
BF 2
      G2
AF1
dtype: int64

Dari hasilnya kita dapat melihat:

  • Ada 3 kemunculan tim A dan posisi G
  • Ada 2 kemunculan tim B dan posisi F
  • Ada 2 kemunculan tim B dan posisi G
  • Ada 1 kemunculan tim A dan posisi F

Perhatikan bahwa kita dapat menggunakan reset_index() untuk mengembalikan DataFrame sebagai gantinya:

 #count frequency of values in team and position columns and return DataFrame
df. value_counts ([' team ',' position ']). reset_index ()

        team position 0
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Kita dapat menggunakan fungsi rename() untuk mengganti nama kolom yang berisi hitungan:

 #get frequency of values in team and position column and rename count column
df. value_counts ([' team ',' position ']). reset_index (). rename (columns={0:' count '})

        team position count
0 A G 3
1 B F 2
2 B G 2
3 A F 1

Hasil akhirnya adalah DataFrame yang berisi frekuensi setiap kombinasi nilai unik pada kolom Tim dan Posisi .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara menggunakan GroupBy dan penghitungan nilai
Pandas: Cara menggunakan GroupBy dengan jumlah bin
Pandas : Cara menghitung nilai pada kolom dengan syarat

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *