Pandas: ігнорувати певні стовпці під час імпорту файлу excel
Ви можете використовувати наступний базовий синтаксис, щоб ігнорувати певні стовпці під час імпорту файлу Excel у pandas DataFrame:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)
Цей конкретний приклад ігноруватиме стовпці в індексних позиціях 1 і 2 під час імпорту файлу Excel під назвою my_data.xlsx у pandas.
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: ігноруйте певні стовпці під час імпорту файлу Excel у Pandas
Скажімо, у нас є такий файл Excel під назвою player_data.xlsx :
Ми можемо використати наступний синтаксис, щоб імпортувати цей файл у pandas DataFrame та ігнорувати стовпці в позиціях індексу 1 і 2 (стовпці з крапкою та відскоком) під час імпорту:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols) #view DataFrame print (df) team assists 0 to 5 1 B 3 2 C 7 3 D 8 4 E 8 5 F 9
Зауважте, що всі стовпці у файлі Excel, крім стовпців у позиціях індексу 1 і 2 (стовпці балів і відскоків), було імпортовано до pandas DataFrame.
Зауважте, що цей метод передбачає, що ви заздалегідь знаєте, скільки стовпців у файлі Excel.
Оскільки ми знали, що всього у файлі 4 стовпці, ми використали діапазон (4) , щоб визначити стовпці, які ми хотіли зберегти.
Примітка . Ви можете знайти повну документацію функції pandas read_excel() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Pandas: як пропускати рядки під час читання файлу Excel
Pandas: як указати типи під час імпорту файлу Excel
Pandas: як об’єднати кілька аркушів Excel