Pandas: видалення певного стовпця під час імпортування файлу csv
Ви можете використовувати такий базовий синтаксис, щоб видалити певний стовпець під час імпорту файлу CSV у pandas DataFrame:
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')
У цьому конкретному прикладі кожен стовпець із файлу CSV під назвою basketball_data.csv буде читатися у DataFrame pandas, за винятком стовпця під назвою rebounds .
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: видаліть певний стовпець під час імпорту файлу CSV у Pandas
Скажімо, у нас є такий файл CSV під назвою basketball_data.csv :
Ми можемо використати такий синтаксис, щоб імпортувати файл CSV у pandas і видалити стовпець під назвою bounces під час імпорту:
import pandas as pd #import all columns except 'rebounds' into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ') #view resulting DataFrame print (df) team points 0 to 22 1 B 14 2 C 29 3 D 30
Зауважте, що стовпець відмов було видалено, коли ми імпортували файл CSV у pandas.
Якщо ви хочете видалити кілька стовпців під час імпорту, ви можете використовувати оператор not in таким чином:
import pandas as pd #import all columns except 'team' and 'rebounds' into DataFrame df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds ']) #view resulting DataFrame print (df) points 0 22 1 14 2 29 3 30
Зауважте, що стовпці команди та підбирання були видалені, коли ми імпортували файл CSV у pandas.
Зауважте, що ви можете включити скільки завгодно імен стовпців у список після оператора not in, щоб видалити скільки завгодно стовпців під час імпорту файлу CSV.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в Python:
Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як використовувати read_csv з аргументом usecols