Pandas: ігнорувати певні стовпці під час імпорту файлу excel


Ви можете використовувати наступний базовий синтаксис, щоб ігнорувати певні стовпці під час імпорту файлу Excel у pandas DataFrame:

 #define columns to skip
skip_cols = [1, 2]

#define columns to keep
keep_cols = [i for i in range (4) if i not in skip_cols]

#import Excel file and skip specific columns
df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)

Цей конкретний приклад ігноруватиме стовпці в індексних позиціях 1 і 2 під час імпорту файлу Excel під назвою my_data.xlsx у pandas.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: ігноруйте певні стовпці під час імпорту файлу Excel у Pandas

Скажімо, у нас є такий файл Excel під назвою player_data.xlsx :

Ми можемо використати наступний синтаксис, щоб імпортувати цей файл у pandas DataFrame та ігнорувати стовпці в позиціях індексу 1 і 2 (стовпці з крапкою та відскоком) під час імпорту:

 #define columns to skip
skip_cols = [1, 2]

#define columns to keep
keep_cols = [i for i in range (4) if i not in skip_cols]

#import Excel file and skip specific columns
df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols)

#view DataFrame
print (df)

  team assists
0 to 5
1 B 3
2 C 7
3 D 8
4 E 8
5 F 9

Зауважте, що всі стовпці у файлі Excel, крім стовпців у позиціях індексу 1 і 2 (стовпці балів і відскоків), було імпортовано до pandas DataFrame.

Зауважте, що цей метод передбачає, що ви заздалегідь знаєте, скільки стовпців у файлі Excel.

Оскільки ми знали, що всього у файлі 4 стовпці, ми використали діапазон (4) , щоб визначити стовпці, які ми хотіли зберегти.

Примітка . Ви можете знайти повну документацію функції pandas read_excel() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Pandas: як пропускати рядки під час читання файлу Excel
Pandas: як указати типи під час імпорту файлу Excel
Pandas: як об’єднати кілька аркушів Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *