Pandy: zignoruj pierwszą kolumnę podczas importowania pliku csv
Możesz użyć następującej podstawowej składni, aby zignorować pierwszą kolumnę podczas importowania pliku CSV do ramki DataFrame pandy:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
W tym konkretnym przykładzie każda kolumna pliku CSV o nazwie koszykówka_data.csv zostanie wczytana do ramki DataFrame pandy, z wyjątkiem pierwszej kolumny.
Używając tego kodu, najpierw znajdujemy liczbę kolumn w pliku CSV i przypisujemy ją do zmiennej o nazwie ncols .
Następnie używamy argumentu usecols , aby określić, że chcemy zaimportować tylko kolumny pomiędzy 1 (tj. drugą kolumną) a ostatnią kolumną pliku CSV.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Zignoruj pierwszą kolumnę podczas importowania pliku CSV do Pand
Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :
Możemy użyć następującej składni, aby zaimportować plik CSV do ramki DataFrame pandy i zignorować pierwszą kolumnę:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Zauważ, że pierwsza kolumna o nazwie zespół została usunięta, gdy zaimportowaliśmy plik CSV do pand.
Pamiętaj, że jeśli znasz już całkowitą liczbę kolumn w pliku CSV, możesz bezpośrednio podać tę wartość do argumentu usecols .
Załóżmy na przykład, że wiemy już, że w pliku CVS znajdują się trzy kolumny.
Możemy użyć następującej składni, aby zaimportować plik CSV do ramki DataFrame pandy i zignorować pierwszą kolumnę:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Zauważ, że pierwsza kolumna o nazwie zespół została usunięta, gdy zaimportowaliśmy plik CSV do pand.
Ponieważ wiedzieliśmy już, że w pliku CSV znajdują się trzy kolumny, po prostu użyliśmy zakresu(1,3) w argumencie usecols .
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols