Bagaimana cara menambahkan array numpy ke pandas dataframe


Terkadang Anda mungkin ingin menambahkan array NumPy sebagai kolom baru ke DataFrame pandas.

Untungnya, Anda dapat melakukannya dengan mudah menggunakan sintaks berikut:

 df[' new_column '] = array_name. tolist ()

Tutorial ini menunjukkan beberapa contoh penggunaan praktis sintaks ini.

Contoh 1: Tambahkan array NumPy sebagai kolom baru di DataFrame

Kode berikut menunjukkan cara membuat DataFrame panda untuk menyimpan beberapa statistik pemain bola basket dan menambahkan array NumPy sebagai kolom baru berlabel “blok”:

 import numpy as np
import pandas as pd

#create pandas DataFrame
df = pd.DataFrame({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#create NumPy array for 'blocks'
blocks = np. array ([2, 3, 1, 0, 2, 7, 8, 2])

#add 'blocks' array as new column in DataFrame
df[' blocks '] = blocks. tolist ()

#display the DataFrame
print(df)

   points assists rebounds blocks
0 25 5 11 2
1 12 7 8 3
2 15 7 10 1
3 14 9 6 0
4 19 12 6 2
5 23 9 5 7
6 25 9 9 8
7 29 4 12 2

Perhatikan bahwa DataFrame baru sekarang memiliki kolom tambahan berjudul Blocks .

Contoh 2: Tambahkan Matriks NumPy sebagai Kolom Baru di DataFrame

Kode berikut menunjukkan cara membuat DataFrame panda untuk menyimpan beberapa statistik pemain bola basket dan menambahkan array NumPy sebagai kolom baru berlabel “blok”:

 import numpy as np
import pandas as pd

#create pandas DataFrame
df = pd.DataFrame({' points ': [25, 12, 15, 14, 19, 23

#create NumPy matrix
mat = np.matrix([[2, 3],
                 [1, 0],
                 [2, 7],
                 [8, 2],
                 [3, 4],
                 [7, 7],
                 [7, 5],
                 [6, 3]])

#add NumPy matrix as new columns in DataFrame
df_new = pd. concat ([df, pd.DataFrame(mat)], axis= 1 )

#display new DataFrame
print(df_new)

   points assists rebounds 0 1
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Perhatikan bahwa nama kolom matriks yang kita tambahkan ke DataFrame diberi nama kolom default 0 dan 1 .

Kita dapat dengan mudah mengganti nama kolom ini menggunakan fungsi df.columns :

 #rename columns
df_new. columns = ['pts', 'ast', 'rebs', 'new1', 'new2']

#display DataFrame
print(df_new)

pts ast rebs new1 new2
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Sumber daya tambahan

Cara menumpuk beberapa Pandas DataFrames
Cara menggabungkan dua Pandas DataFrames di index
Bagaimana mengonversi Pandas DataFrame ke array NumPy
Cara mengganti nama kolom di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *