Pandy: usuń określoną kolumnę podczas importowania pliku csv
Możesz użyć następującej podstawowej składni, aby usunąć określoną kolumnę podczas importowania pliku CSV do ramki DataFrame pandy:
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')
W tym konkretnym przykładzie każda kolumna z pliku CSV o nazwie koszykówka_data.csv zostanie wczytana do ramki DataFrame pandy, z wyjątkiem kolumny o nazwie Rebounds .
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Usuń określoną kolumnę podczas importowania pliku CSV do Pand
Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :
Możemy użyć następującej składni, aby zaimportować plik CSV do pand i usunąć podczas importu kolumnę o nazwie „odbicia” :
import pandas as pd #import all columns except 'rebounds' into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ') #view resulting DataFrame print (df) team points 0 to 22 1 B 14 2 C 29 3 D 30
Pamiętaj, że kolumna odrzuceń została usunięta, gdy zaimportowaliśmy plik CSV do pand.
Jeśli podczas importu chcesz usunąć wiele kolumn, możesz użyć operatora not in w następujący sposób:
import pandas as pd #import all columns except 'team' and 'rebounds' into DataFrame df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds ']) #view resulting DataFrame print (df) points 0 22 1 14 2 29 3 30
Należy pamiętać, że kolumny drużyny i zbiórek zostały usunięte, gdy zaimportowaliśmy plik CSV do pand.
Pamiętaj, że po operatorze not in możesz umieścić na liście dowolną liczbę nazw kolumn, aby usunąć dowolną liczbę kolumn podczas importowania pliku CSV.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols