Pandy: jak używać pierwszej kolumny jako indeksu
Możesz użyć następujących metod, aby użyć pierwszej kolumny jako kolumny indeksu w ramce DataFrame pandy:
Metoda 1: Użyj pierwszej kolumny jako indeksu podczas importowania ramki DataFrame
df = pd. read_csv (' my_data.csv ', index_col= 0 )
Metoda 2: Użyj pierwszej kolumny jako indeksu w istniejącej ramce DataFrame
df = df. set_index ([' column1 '])
Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce.
Przykład 1: Użyj pierwszej kolumny jako indeksu podczas importowania ramki DataFrame
Załóżmy, że mamy następujący plik CSV o nazwie my_data.csv :
Jeśli zaimportujemy plik CSV bez określenia kolumny indeksu, pandy po prostu utworzą kolumnę indeksu z wartościami liczbowymi zaczynającymi się od 0:
#import CSV file without specifying index column df = pd. read_csv (' my_data.csv ') #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Możemy jednak użyć argumentu indeks_col , aby określić, że pierwsza kolumna pliku CSV powinna zostać użyta jako kolumna indeksu:
#import CSV file and specify index column df = pd. read_csv (' my_data.csv ', index_col= 0 ) #view DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Należy pamiętać, że kolumna zespołu jest teraz używana jako kolumna indeksu.
Przykład 2: Użyj pierwszej kolumny jako indeksu w istniejącej ramce DataFrame
Załóżmy, że mamy następującą istniejącą ramkę DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame df team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Możemy użyć funkcji set_index() , aby ustawić kolumnę zespołu jako kolumnę indeksu:
#set 'team' column as index column df = df. set_index ([' team ']) #view updated DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Należy pamiętać, że kolumna zespołu jest teraz używana jako kolumna indeksu.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak wybrać kolumny według indeksu w ramce danych Pandas
Jak zmienić nazwę indeksu w Pandas DataFrame
Jak usunąć kolumny według indeksu w Pandach