Як об’єднати кілька аркушів excel у pandas
Часто вам може знадобитися імпортувати та об’єднати кілька аркушів Excel в один DataFrame pandas.
Наприклад, припустімо, що у вас є така книга Excel під назвою data.xlsx із трьома різними аркушами, які містять два стовпці даних про баскетболістів:
Ми можемо легко імпортувати та об’єднати кожен аркуш в єдиний pandas DataFrame за допомогою функцій pandas concat() і read_excel() , але спочатку нам потрібно переконатися, що xlrd встановлено:
pip install xlrd
Після встановлення ми можемо використовувати наступний код, щоб імпортувати та об’єднати ці три аркуші в один Pandas DataFrame:
#load pandas library import pandas as pd #import and combine the three sheets into one pandas DataFrame df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True ) #view DataFrame df player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7:27 a.m. 8 I 27 9 D 12 10K 9 11 L 5 12 M 5 13 N 13 14 O 17
Як працює цей код
Є лише дві частини, щоб зрозуміти, як цей єдиний рядок коду може імпортувати та об’єднувати кілька аркушів Excel:
1. Прочитайте всі аркуші.
p.d. read_excel ('data.xlsx', sheet_name= None )
Цей фрагмент коду читається на всіх аркушах книги Excel. За замовчуванням функція read_excel() читає лише перший аркуш, але якщо вказати sheet_name=None, ми зможемо читати кожен аркуш у книзі Excel.
2. Об’єднайте всі аркуші.
p.d. concat ( DataFrames to concatenate , ignore_index= True )
Цей фрагмент коду просто об’єднує всі DataFrame з кожного аркуша Excel в один DataFrame pandas. Вказуючи ignore_index=True , ми повідомляємо пандам, що назви окремих листків не важливі.
Зауважте, що цей код працює, лише якщо кожен аркуш Excel має однаковий формат. У цьому прикладі кожен аркуш мав два стовпці даних, і кожен стовпець мав однакову назву, тому цей єдиний рядок коду спрацював так легко, щоб об’єднати кожен аркуш Excel в єдиний DataFrame pandas.
Додаткові ресурси
Повний посібник: як читати файли Excel за допомогою Pandas
Як записати Pandas DataFrames на кількох аркушах Excel