Pandas: cara membaca file excel dengan sel yang digabungkan
Saat Anda membaca file Excel dengan sel yang digabungkan ke dalam DataFrame pandas, sel yang digabungkan akan secara otomatis diisi dengan nilai NaN.
Cara termudah untuk mengisi nilai NaN ini setelah mengimpor file adalah dengan menggunakan fungsi pandas fillna() sebagai berikut:
df = df. fillna (method=' ffill ', axis= 0 )
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Membaca file Excel dengan sel gabungan di Pandas
Katakanlah kita memiliki file Excel berikut bernama merge_data.xlsx yang berisi informasi tentang berbagai pemain bola basket:
Perhatikan bahwa nilai-nilai di kolom Tim digabungkan.
Pemain A sampai D milik Mavericks sedangkan pemain E sampai H milik Rockets.
Misalkan kita menggunakan fungsi read_excel() untuk membaca file Excel ini menjadi DataFrame pandas:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
Secara default, panda mengisi sel gabungan dengan nilai NaN.
Untuk mengisi setiap nilai NaN tersebut dengan nama tim, kita dapat menggunakan fungsi fillna() sebagai berikut:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
Perhatikan bahwa setiap nilai NaN telah diisi dengan nama tim yang sesuai.
Perhatikan bahwa argumen axis=0 memberitahu panda untuk mengisi nilai NaN secara vertikal.
Untuk mengisi nilai NaN secara horizontal pada kolom, Anda dapat menentukan axis=1 .
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas fillna() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: Cara melewati baris saat membaca file Excel
Pandas: Cara menentukan tipe saat mengimpor file Excel
Pandas: Cara menggabungkan beberapa lembar Excel