Bagaimana cara menambahkan kolom angka ke pandas dataframe


Anda dapat menggunakan sintaks dasar berikut untuk menambahkan kolom “hitungan” ke DataFrame pandas:

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

Sintaks khusus ini menambahkan kolom bernama var1_count ke DataFrame yang berisi jumlah nilai dalam kolom bernama var1 .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Tambahkan kolom angka di Pandas

Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang berbagai pemain bola basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

Kita dapat menggunakan kode berikut untuk menambahkan kolom bernama team_count yang berisi jumlah setiap tim:

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

Terdapat 3 baris dengan nilai tim A dan 5 baris dengan nilai tim B.

Jadi:

  • Untuk setiap baris yang teamnya sama dengan A, nilai di kolom team_count adalah 3 .
  • Untuk setiap baris yang teamnya sama dengan B, nilai di kolom team_count adalah 5 .

Anda juga dapat menambahkan kolom “akun” yang mengelompokkan beberapa variabel.

Misalnya, kode berikut menunjukkan cara menambahkan kolom “hitungan” yang mengelompokkan variabel tim dan pos :

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

Dari hasilnya kita dapat melihat:

  • Terdapat 1 baris yang berisi A pada kolom tim dan Gu pada kolom pos .
  • Terdapat 2 baris yang berisi A pada kolom tim dan Fo pada kolom pos .
  • Terdapat 3 baris yang berisi B pada kolom tim dan Fo pada kolom pos .
  • Terdapat 2 baris yang berisi B pada kolom tim dan Gu pada kolom pos .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara menggunakan GroupBy dan penghitungan nilai
Pandas: Cara menggunakan GroupBy dengan jumlah bin
Pandas : Cara menghitung nilai pada kolom dengan syarat

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *