Pandas: как прочитать файл excel с объединенными ячейками
Когда вы читаете файл Excel с объединенными ячейками в DataFrame pandas, объединенные ячейки автоматически заполняются значениями NaN.
Самый простой способ заполнить эти значения NaN после импорта файла — использовать функцию pandas fillna() следующим образом:
df = df. fillna (method=' ffill ', axis= 0 )
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: чтение файла Excel с объединенными ячейками в Pandas
Допустим, у нас есть следующий файл Excel с именем merged_data.xlsx , который содержит информацию о различных баскетболистах:
Обратите внимание, что значения в столбце «Команда» объединены.
Игроки от A до D принадлежат «Маверикс», а игроки от E до H принадлежат «Рокетс».
Предположим, мы используем функцию read_excel() для чтения этого файла Excel в DataFrame pandas:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
По умолчанию pandas заполняет объединенные ячейки значениями NaN.
Чтобы заполнить каждое из этих значений NaN названиями команд, мы можем использовать функцию fillna() следующим образом:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
Обратите внимание, что каждое из значений NaN заполнено соответствующим названием команды.
Обратите внимание, что аргумент axis=0 сообщает пандам заполнять значения NaN вертикально.
Чтобы заполнить значения NaN по горизонтали в столбцах, вы можете указать axis=1 .
Примечание . Полную документацию по функции pandas fillna() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Pandas: как пропускать строки при чтении файла Excel
Pandas: как указать типы при импорте файла Excel
Pandas: как объединить несколько листов Excel