Pandy: ignoruj określone kolumny podczas importowania pliku excel
Możesz użyć następującej podstawowej składni, aby zignorować określone kolumny podczas importowania pliku Excel do ramki DataFrame pandy:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)
Ten konkretny przykład zignoruje kolumny w pozycjach indeksu 1 i 2 podczas importowania pliku Excel o nazwie my_data.xlsx do pand.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Ignoruj określone kolumny podczas importowania pliku Excel do Pand
Załóżmy, że mamy następujący plik Excela o nazwie player_data.xlsx :
Możemy użyć następującej składni, aby zaimportować ten plik do pandas DataFrame i zignorować kolumny w pozycjach indeksu 1 i 2 (kolumny z kropką i odbiciem) podczas importu:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols) #view DataFrame print (df) team assists 0 to 5 1 B 3 2 C 7 3 D 8 4 E 8 5 F 9
Należy zauważyć, że wszystkie kolumny w pliku Excel z wyjątkiem kolumn na pozycjach indeksu 1 i 2 (kolumny punktów i odbić) zostały zaimportowane do ramki DataFrame pand.
Pamiętaj, że w tej metodzie zakłada się, że wiesz z góry, ile kolumn znajduje się w pliku Excel.
Ponieważ wiedzieliśmy, że w pliku znajdują się łącznie 4 kolumny, użyliśmy funkcji range(4) do zdefiniowania kolumn, które chcemy zachować.
Uwaga : pełną dokumentację funkcji pandy read_excel() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: Jak pominąć linie podczas czytania pliku Excel
Pandy: Jak określić typy podczas importowania pliku Excel
Pandy: Jak połączyć wiele arkuszy Excela