Pandas: cara menggunakan groupby dan penghitungan nilai


Anda dapat menggunakan sintaks dasar berikut untuk menghitung frekuensi nilai unik per grup dalam pandas DataFrame:

 df. groupby ([' column1 ', ' column2 ']). size (). unstack (fill_value= 0 )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Menggunakan GroupBy dan Value Counts di Pandas

Misalkan kita memiliki panda DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ':['G', 'G', 'F', 'F', 'C', 'G', 'F', 'F', 'F', 'F'],
                   ' points ': [8, 8, 10, 10, 11, 8, 9, 10, 10, 10]})

#view DataFrame
print (df)

  team position points
0 AG 8
1 GA 8
2 AF10
3 AF 10
4 AC 11
5 BG 8
6 BF 9
7 BF 10
8 BF 10
9 BF 10

Kita dapat menggunakan sintaks berikut untuk menghitung frekuensi nilai poin , yang dikelompokkan berdasarkan kolom tim dan posisi :

 #count frequency of points values, grouped by team and position
df. groupby ([' team ',' position ',' points ']). size (). unstack (fill_value= 0 )

	points 8 9 10 11
team position				
A C 0 0 0 1
        F 0 0 2 0
        G 2 0 0 0
B F 0 1 3 0
        G 1 0 0 0

Berikut cara menafsirkan hasilnya:

  • Nilai 8 muncul 0 kali pada kolom poin untuk pemain tim A dan posisi C.
  • Nilai 9 muncul 0 kali pada kolom poin untuk pemain tim A dan posisi C.
  • Nilai 10 muncul 0 kali pada kolom poin untuk pemain tim A dan posisi C.
  • Nilai 11 muncul pada kolom poin sebanyak 1 kali untuk pemain tim A dan posisi C.

Dan seterusnya.

Kita juga dapat menggunakan sintaks berikut untuk menghitung frekuensi posisi , yang dikelompokkan berdasarkan tim :

 #count frequency of positions, grouped by team
df. groupby ([' team ', ' position ']). size (). unstack (fill_value= 0 )

position C F G
team			
A 1 2 2
B 0 4 1

Berikut cara menafsirkan hasilnya:

  • Nilai ‘C’ muncul 1 kali pada tim A.
  • Nilai ‘F’ muncul 2 kali pada tim A.
  • Nilai ‘G’ muncul 2 kali pada tim A.
  • Nilai ‘C’ muncul 0 kali pada tim B.
  • Nilai ‘F’ terjadi sebanyak 4 kali pada Tim B.
  • Nilai ‘G’ terjadi 1 kali pada tim B.

Dan seterusnya.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara melakukan penjumlahan GroupBy di Pandas
Cara menghitung nilai unik menggunakan GroupBy di Pandas
Cara menggunakan Groupby dan Plot di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *