Pandas: cara membaca file excel dengan sel yang digabungkan


Saat Anda membaca file Excel dengan sel yang digabungkan ke dalam DataFrame pandas, sel yang digabungkan akan secara otomatis diisi dengan nilai NaN.

Cara termudah untuk mengisi nilai NaN ini setelah mengimpor file adalah dengan menggunakan fungsi pandas fillna() sebagai berikut:

 df = df. fillna (method=' ffill ', axis= 0 )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Membaca file Excel dengan sel gabungan di Pandas

Katakanlah kita memiliki file Excel berikut bernama merge_data.xlsx yang berisi informasi tentang berbagai pemain bola basket:

Perhatikan bahwa nilai-nilai di kolom Tim digabungkan.

Pemain A sampai D milik Mavericks sedangkan pemain E sampai H milik Rockets.

Misalkan kita menggunakan fungsi read_excel() untuk membaca file Excel ini menjadi DataFrame pandas:

 import pandas as pd

#import Excel fie
df = pd. read_excel (' merged_data.xlsx ' )

#view DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 NaN B 29 4
2 NaN C 45 3
3 NaN D 30 7
4 Rockets E 29 8
5 NaN F 16 6
6 NaN G 25 9
7 NaN H 20 12

Secara default, panda mengisi sel gabungan dengan nilai NaN.

Untuk mengisi setiap nilai NaN tersebut dengan nama tim, kita dapat menggunakan fungsi fillna() sebagai berikut:

 #fill in NaN values with team names
df = df. fillna (method=' ffill ', axis= 0 )

#view updated DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 Mavericks B 29 4
2 Mavericks C 45 3
3 Mavericks D 30 7
4 Rockets E 29 8
5 Rockets F 16 6
6 Rockets G 25 9
7 Rockets M 20 12

Perhatikan bahwa setiap nilai NaN telah diisi dengan nama tim yang sesuai.

Perhatikan bahwa argumen axis=0 memberitahu panda untuk mengisi nilai NaN secara vertikal.

Untuk mengisi nilai NaN secara horizontal pada kolom, Anda dapat menentukan axis=1 .

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas fillna() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara melewati baris saat membaca file Excel
Pandas: Cara menentukan tipe saat mengimpor file Excel
Pandas: Cara menggabungkan beberapa lembar Excel

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *