Як об’єднати кілька аркушів excel у pandas


Часто вам може знадобитися імпортувати та об’єднати кілька аркушів Excel в один DataFrame pandas.

Наприклад, припустімо, що у вас є така книга Excel під назвою data.xlsx із трьома різними аркушами, які містять два стовпці даних про баскетболістів:

Ми можемо легко імпортувати та об’єднати кожен аркуш в єдиний pandas DataFrame за допомогою функцій pandas concat() і read_excel() , але спочатку нам потрібно переконатися, що xlrd встановлено:

 pip install xlrd

Після встановлення ми можемо використовувати наступний код, щоб імпортувати та об’єднати ці три аркуші в один Pandas DataFrame:

 #load pandas library
import pandas as pd

#import and combine the three sheets into one pandas DataFrame
df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True )

#view DataFrame
df

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

Як працює цей код

Є лише дві частини, щоб зрозуміти, як цей єдиний рядок коду може імпортувати та об’єднувати кілька аркушів Excel:

1. Прочитайте всі аркуші.

 p.d. read_excel ('data.xlsx', sheet_name= None )

Цей фрагмент коду читається на всіх аркушах книги Excel. За замовчуванням функція read_excel() читає лише перший аркуш, але якщо вказати sheet_name=None, ми зможемо читати кожен аркуш у книзі Excel.

2. Об’єднайте всі аркуші.

 p.d. concat ( DataFrames to concatenate , ignore_index= True )

Цей фрагмент коду просто об’єднує всі DataFrame з кожного аркуша Excel в один DataFrame pandas. Вказуючи ignore_index=True , ми повідомляємо пандам, що назви окремих листків не важливі.

Зауважте, що цей код працює, лише якщо кожен аркуш Excel має однаковий формат. У цьому прикладі кожен аркуш мав два стовпці даних, і кожен стовпець мав однакову назву, тому цей єдиний рядок коду спрацював так легко, щоб об’єднати кожен аркуш Excel в єдиний DataFrame pandas.

Додаткові ресурси

Повний посібник: як читати файли Excel за допомогою Pandas
Як записати Pandas DataFrames на кількох аркушах Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *