Pandas: cara membuat kolom jika tidak ada
Anda dapat menggunakan sintaks dasar berikut untuk membuat kolom di pandas DataFrame jika belum ada:
df[' my_column '] = df. get (' my_column ', df[' col1 '] * df[' col2 '])
Sintaks khusus ini membuat kolom baru bernama my_column jika belum ada di DataFrame dan didefinisikan sebagai produk dari kolom yang ada col1 dan col2 .
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: buat kolom di Pandas jika belum ada
Misalkan kita memiliki panda DataFrame berikut:
import pandas as pd #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' sales ': [4, 6, 5, 8, 14, 13, 13, 12, 9, 8, 19, 14], ' price ': [1, 2, 2, 1, 2, 4, 4, 3, 3, 2, 2, 3]}) #view DataFrame print (df) day sales price 0 1 4 1 1 2 6 2 2 3 5 2 3 4 8 1 4 5 14 2 5 6 13 4 6 7 13 4 7 8 12 3 8 9 9 3 9 10 8 2 10 11 19 2 11 12 14 3
Sekarang katakanlah kita mencoba menambahkan kolom bernama harga jika belum ada dan mendefinisikannya sebagai kolom yang setiap nilainya adalah 100:
#attempt to add column called 'price'
df[' price '] = df. get (' price ', 100)
#view updated DataFrame
print (df)
day sales price
0 1 4 1
1 2 6 2
2 3 5 2
3 4 8 1
4 5 14 2
5 6 13 4
6 7 13 4
7 8 12 3
8 9 9 3
9 10 8 2
10 11 19 2
11 12 14 3
Karena kolom bernama harga sudah ada, pandas tidak menambahkannya ke DataFrame.
Namun, misalkan kita mencoba menambahkan kolom baru bernama pendapatan jika belum ada dan mendefinisikannya sebagai kolom yang nilainya merupakan produk dari kolom penjualan dan harga:
#attempt to add column called 'revenue'
df[' revenue '] = df. get (' revenue ', df[' sales '] * df[' price '])
#view updated DataFrame
print (df)
day sales price revenue
0 1 4 1 4
1 2 6 2 12
2 3 5 2 10
3 4 8 1 8
4 5 14 2 28
5 6 13 4 52
6 7 13 4 52
7 8 12 3 36
8 9 9 3 27
9 10 8 2 16
10 11 19 2 38
11 12 14 3 42
Kolom pendapatan ini ditambahkan ke DataFrame karena belum ada.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Cara menghapus baris di Pandas DataFrame berdasarkan kondisi
Cara memfilter Pandas DataFrame pada berbagai kondisi
Cara menggunakan filter “TIDAK DALAM” di Pandas DataFrame