Полное руководство: как читать файлы excel с помощью pandas
Файлы Excel являются одним из наиболее распространенных способов хранения данных. К счастью, функция pandas read_excel() позволяет легко читать файлы Excel.
В этом руководстве объясняется несколько способов чтения файлов Excel на Python с помощью pandas.
Пример 1. Считайте файл Excel в DataFrame pandas.
Предположим, у нас есть следующий файл Excel:
Следующий код показывает, как использовать функцию read_excel() для импорта этого файла Excel в DataFrame pandas:
import pandas as pd #import Excel file df = pd. read_excel ('data.xlsx') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Пример 2. Чтение файла Excel с индексным столбцом
Иногда у вас также может быть файл Excel, в котором один из столбцов является индексным столбцом:
В этом случае вы можете использовать index_col , чтобы указать пандам, какой столбец использовать в качестве индексного столбца при импорте:
import pandas as pd #import Excel file, specifying the index column df = pd. read_excel ('data.xlsx', index_col=' index ') #view DataFrame df playerID team points index 1 1 Lakers 26 2 2 Mavs 19 3 3 Bucks 24 4 4 Spurs 22
Пример 3. Чтение файла Excel по имени листа
Вы также можете прочитать определенные имена листов из файла Excel в DataFrame pandas. Например, рассмотрим следующий файл Excel:
Чтобы прочитать конкретный лист как DataFrame pandas, вы можете использовать аргументsheet_name() :
import pandas as pd #import only second sheet df = pd. read_excel ('data.xlsx', sheet_name=' second sheet ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Распространенная ошибка: установка xlrd
При попытке использовать функцию read_excel() вы можете столкнуться со следующей ошибкой:
ImportError: Install xlrd >= 1.0.0 for Excel support
В этом случае сначала необходимо установить xlrd:
pip install xlrd
После установки вы можете использовать функцию read_excel() .
Дополнительные ресурсы
Как читать файлы CSV с помощью Pandas
Как экспортировать DataFrame Pandas в Excel