Pandas: как прочитать файл excel с объединенными ячейками


Когда вы читаете файл Excel с объединенными ячейками в DataFrame pandas, объединенные ячейки автоматически заполняются значениями NaN.

Самый простой способ заполнить эти значения NaN после импорта файла — использовать функцию pandas fillna() следующим образом:

 df = df. fillna (method=' ffill ', axis= 0 )

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: чтение файла Excel с объединенными ячейками в Pandas

Допустим, у нас есть следующий файл Excel с именем merged_data.xlsx , который содержит информацию о различных баскетболистах:

Обратите внимание, что значения в столбце «Команда» объединены.

Игроки от A до D принадлежат «Маверикс», а игроки от E до H принадлежат «Рокетс».

Предположим, мы используем функцию read_excel() для чтения этого файла Excel в DataFrame pandas:

 import pandas as pd

#import Excel fie
df = pd. read_excel (' merged_data.xlsx ' )

#view DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 NaN B 29 4
2 NaN C 45 3
3 NaN D 30 7
4 Rockets E 29 8
5 NaN F 16 6
6 NaN G 25 9
7 NaN H 20 12

По умолчанию pandas заполняет объединенные ячейки значениями NaN.

Чтобы заполнить каждое из этих значений NaN названиями команд, мы можем использовать функцию fillna() следующим образом:

 #fill in NaN values with team names
df = df. fillna (method=' ffill ', axis= 0 )

#view updated DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 Mavericks B 29 4
2 Mavericks C 45 3
3 Mavericks D 30 7
4 Rockets E 29 8
5 Rockets F 16 6
6 Rockets G 25 9
7 Rockets M 20 12

Обратите внимание, что каждое из значений NaN заполнено соответствующим названием команды.

Обратите внимание, что аргумент axis=0 сообщает пандам заполнять значения NaN вертикально.

Чтобы заполнить значения NaN по горизонтали в столбцах, вы можете указать axis=1 .

Примечание . Полную документацию по функции pandas fillna() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Pandas: как пропускать строки при чтении файла Excel
Pandas: как указать типы при импорте файла Excel
Pandas: как объединить несколько листов Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *