Pandy: zignoruj pierwszą kolumnę podczas importowania pliku csv


Możesz użyć następującej podstawowej składni, aby zignorować pierwszą kolumnę podczas importowania pliku CSV do ramki DataFrame pandy:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

W tym konkretnym przykładzie każda kolumna pliku CSV o nazwie koszykówka_data.csv zostanie wczytana do ramki DataFrame pandy, z wyjątkiem pierwszej kolumny.

Używając tego kodu, najpierw znajdujemy liczbę kolumn w pliku CSV i przypisujemy ją do zmiennej o nazwie ncols .

Następnie używamy argumentu usecols , aby określić, że chcemy zaimportować tylko kolumny pomiędzy 1 (tj. drugą kolumną) a ostatnią kolumną pliku CSV.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Zignoruj pierwszą kolumnę podczas importowania pliku CSV do Pand

Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :

Możemy użyć następującej składni, aby zaimportować plik CSV do ramki DataFrame pandy i zignorować pierwszą kolumnę:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Zauważ, że pierwsza kolumna o nazwie zespół została usunięta, gdy zaimportowaliśmy plik CSV do pand.

Pamiętaj, że jeśli znasz już całkowitą liczbę kolumn w pliku CSV, możesz bezpośrednio podać tę wartość do argumentu usecols .

Załóżmy na przykład, że wiemy już, że w pliku CVS znajdują się trzy kolumny.

Możemy użyć następującej składni, aby zaimportować plik CSV do ramki DataFrame pandy i zignorować pierwszą kolumnę:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Zauważ, że pierwsza kolumna o nazwie zespół została usunięta, gdy zaimportowaliśmy plik CSV do pand.

Ponieważ wiedzieliśmy już, że w pliku CSV znajdują się trzy kolumny, po prostu użyliśmy zakresu(1,3) w argumencie usecols .

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *