Pandy: jak używać read_csv z argumentem usecols
Możesz użyć argumentu usecols w funkcji read_csv() , aby wczytać określone kolumny z pliku CSV do ramki DataFrame pandy.
Istnieją dwa typowe sposoby użycia tego argumentu:
Metoda 1: Użyj usecols z nazwami kolumn
df = pd. read_csv (' my_data.csv ', usecols=[' this_column ', ' that_column '])
Metoda 2: Użyj usecols z pozycjami kolumn
df = pd. read_csv ( ' my_data.csv ', usecols=[ 0,2 ])
Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującym plikiem CSV o nazwie koszykówka_data.csv :
Przykład 1: Używanie usecols z nazwami kolumn
Możemy użyć poniższego kodu, aby zaimportować plik CSV i używać tylko kolumn o nazwie „zespół” i „zbiórki”:
import pandas as pd #import DataFrame and only use 'team' and 'rebounds' columns df = pd. read_csv (' basketball_data.csv ', usecols=[' team ',' rebounds ']) #view DataFrame print (df) team rebounds 0 to 10 1 B 9 2 C 6 3 D 2
Należy zauważyć, że zaimportowano tylko kolumny drużyny i zbiórek, ponieważ były to nazwy kolumn, które określiliśmy w argumencie usecols .
Przykład 2: Używanie usecols z pozycjami kolumn
Możemy użyć poniższego kodu, aby zaimportować plik CSV i użyć kolumn tylko na pozycjach indeksu 0 i 2:
import pandas as pd #import DataFrame and only use columns in index positions 0 and 2 df = pd. read_csv (' basketball_data.csv ' , usecols=[ 0,2 ]) #view DataFrame print (df) team rebounds 0 to 10 1 B 9 2 C 6 3 D 2
Należy pamiętać, że zaimportowano tylko kolumny drużyny i zbiórek, ponieważ były to kolumny na pozycjach indeksu 0 i 2, czyli wartości, które określiliśmy w argumencie usecols .
Uwaga : Pierwsza kolumna pliku CSV ma pozycję indeksu 0.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak czytać pliki Excel
Pandy: Jak wyeksportować ramkę danych do programu Excel