Pandas: як читати файл excel із об’єднаними клітинками


Коли ви читаєте файл Excel із об’єднаними клітинками в pandas DataFrame, об’єднані клітинки автоматично заповнюються значеннями NaN.

Найпростіший спосіб заповнити ці значення NaN після імпорту файлу — це використовувати функцію pandas fillna() наступним чином:

 df = df. fillna (method=' ffill ', axis= 0 )

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: читайте файл Excel із об’єднаними клітинками в Pandas

Скажімо, у нас є такий файл Excel під назвою merged_data.xlsx , який містить інформацію про різних баскетболістів:

Зверніть увагу, що значення в стовпці Команда об’єднані.

Гравці від A до D належать до Mavericks, а гравці від E до H належать до Rockets.

Припустімо, ми використовуємо функцію read_excel() , щоб прочитати цей файл Excel у pandas DataFrame:

 import pandas as pd

#import Excel fie
df = pd. read_excel (' merged_data.xlsx ' )

#view DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 NaN B 29 4
2 NaN C 45 3
3 NaN D 30 7
4 Rockets E 29 8
5 NaN F 16 6
6 NaN G 25 9
7 NaN H 20 12

За замовчуванням pandas заповнює об’єднані клітинки значеннями NaN.

Щоб заповнити кожне з цих значень NaN назвами команд, ми можемо використати функцію fillna() наступним чином:

 #fill in NaN values with team names
df = df. fillna (method=' ffill ', axis= 0 )

#view updated DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 Mavericks B 29 4
2 Mavericks C 45 3
3 Mavericks D 30 7
4 Rockets E 29 8
5 Rockets F 16 6
6 Rockets G 25 9
7 Rockets M 20 12

Зверніть увагу, що кожне зі значень NaN було заповнено відповідною назвою команди.

Зауважте, що аргумент axis=0 повідомляє pandas заповнювати значення NaN вертикально.

Щоб заповнити значення NaN по горизонталі в стовпцях, ви можете вказати axis=1 .

Примітка . Повну документацію щодо функції pandas fillna() можна знайти тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Pandas: Як пропускати рядки під час читання файлу Excel
Pandas: як указати типи під час імпорту файлу Excel
Pandas: як об’єднати кілька аркушів Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *