Pandy: jak używać pierwszej kolumny jako indeksu


Możesz użyć następujących metod, aby użyć pierwszej kolumny jako kolumny indeksu w ramce DataFrame pandy:

Metoda 1: Użyj pierwszej kolumny jako indeksu podczas importowania ramki DataFrame

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

Metoda 2: Użyj pierwszej kolumny jako indeksu w istniejącej ramce DataFrame

 df = df. set_index ([' column1 '])

Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce.

Przykład 1: Użyj pierwszej kolumny jako indeksu podczas importowania ramki DataFrame

Załóżmy, że mamy następujący plik CSV o nazwie my_data.csv :

Jeśli zaimportujemy plik CSV bez określenia kolumny indeksu, pandy po prostu utworzą kolumnę indeksu z wartościami liczbowymi zaczynającymi się od 0:

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Możemy jednak użyć argumentu indeks_col , aby określić, że pierwsza kolumna pliku CSV powinna zostać użyta jako kolumna indeksu:

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Należy pamiętać, że kolumna zespołu jest teraz używana jako kolumna indeksu.

Przykład 2: Użyj pierwszej kolumny jako indeksu w istniejącej ramce DataFrame

Załóżmy, że mamy następującą istniejącą ramkę DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Możemy użyć funkcji set_index() , aby ustawić kolumnę zespołu jako kolumnę indeksu:

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Należy pamiętać, że kolumna zespołu jest teraz używana jako kolumna indeksu.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak wybrać kolumny według indeksu w ramce danych Pandas
Jak zmienić nazwę indeksu w Pandas DataFrame
Jak usunąć kolumny według indeksu w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *