Pandas: buat tabel pivot dengan beberapa aggfunc


Anda dapat menggunakan sintaks berikut untuk membuat tabel pivot di panda dan memberikan beberapa nilai ke argumen aggfunc :

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

Contoh khusus ini membuat tabel pivot yang menampilkan jumlah dan rata-rata nilai dalam col2 , dikelompokkan berdasarkan col1 .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Membuat tabel pivot Pandas dengan beberapa aggfunc

Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang berbagai pemain bola basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Kita dapat menggunakan kode berikut untuk membuat tabel pivot yang merangkum jumlah dan rata-rata jumlah poin yang dicetak oleh masing-masing tim :

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

Tabel pivot yang dihasilkan merangkum rata-rata dan jumlah poin yang dicetak oleh masing-masing tim.

Misalnya, kita dapat melihat:

  • Pemain Tim A memiliki nilai poin rata-rata 4,50 dan total nilai poin 18 .
  • Pemain tim B memiliki nilai rata-rata poin 6,50 dan total nilai poin 26 .
  • Pemain tim C memiliki nilai rata-rata poin 5,75 dan total nilai poin 23 .

Perhatikan bahwa kami melakukan agregat menggunakan jumlah dan rata-rata dalam contoh ini, namun kami juga dapat menggabungkan berdasarkan metrik lain seperti:

  • menghitung
  • menit
  • maksimum
  • median
  • std (deviasi standar)

Contoh berikut menunjukkan cara menggabungkan nilai kolom poin berdasarkan metrik ini untuk setiap tim:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas pivot_table() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas panda umum lainnya:

Pandas: Cara mengurutkan tabel pivot berdasarkan nilai di kolom
Pandas: Cara membuat tabel pivot dengan jumlah nilai
Pandas: Cara menambahkan subtotal ke tabel pivot
Pandas: Cara mengubah nama kolom di tabel pivot

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *