Pandy: jak używać read_csv z argumentem usecols


Możesz użyć argumentu usecols w funkcji read_csv() , aby wczytać określone kolumny z pliku CSV do ramki DataFrame pandy.

Istnieją dwa typowe sposoby użycia tego argumentu:

Metoda 1: Użyj usecols z nazwami kolumn

 df = pd. read_csv (' my_data.csv ', usecols=[' this_column ', ' that_column '])

Metoda 2: Użyj usecols z pozycjami kolumn

 df = pd. read_csv ( ' my_data.csv ', usecols=[ 0,2 ])

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującym plikiem CSV o nazwie koszykówka_data.csv :

Przykład 1: Używanie usecols z nazwami kolumn

Możemy użyć poniższego kodu, aby zaimportować plik CSV i używać tylko kolumn o nazwie „zespół” i „zbiórki”:

 import pandas as pd

#import DataFrame and only use 'team' and 'rebounds' columns
df = pd. read_csv (' basketball_data.csv ', usecols=[' team ',' rebounds '])

#view DataFrame
print (df)

   team rebounds
0 to 10
1 B 9
2 C 6
3 D 2

Należy zauważyć, że zaimportowano tylko kolumny drużyny i zbiórek, ponieważ były to nazwy kolumn, które określiliśmy w argumencie usecols .

Przykład 2: Używanie usecols z pozycjami kolumn

Możemy użyć poniższego kodu, aby zaimportować plik CSV i użyć kolumn tylko na pozycjach indeksu 0 i 2:

 import pandas as pd

#import DataFrame and only use columns in index positions 0 and 2
df = pd. read_csv (' basketball_data.csv ' , usecols=[ 0,2 ])

#view DataFrame
print (df)

   team rebounds
0 to 10
1 B 9
2 C 6
3 D 2

Należy pamiętać, że zaimportowano tylko kolumny drużyny i zbiórek, ponieważ były to kolumny na pozycjach indeksu 0 i 2, czyli wartości, które określiliśmy w argumencie usecols .

Uwaga : Pierwsza kolumna pliku CSV ma pozycję indeksu 0.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak czytać pliki Excel
Pandy: Jak wyeksportować ramkę danych do programu Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *