Pandas: cara menggunakan kolom pertama sebagai indeks


Anda dapat menggunakan metode berikut untuk menggunakan kolom pertama sebagai kolom indeks di pandas DataFrame:

Metode 1: Gunakan kolom pertama sebagai indeks saat mengimpor DataFrame

 df = pd. read_csv (' my_data.csv ', index_col= 0 )

Metode 2: Gunakan kolom pertama sebagai indeks dengan DataFrame yang ada

 df = df. set_index ([' column1 '])

Contoh berikut menunjukkan cara menggunakan masing-masing metode dalam praktik.

Contoh 1: Gunakan kolom pertama sebagai indeks saat mengimpor DataFrame

Katakanlah kita memiliki file CSV berikut bernama my_data.csv :

Jika kita mengimpor file CSV tanpa menentukan kolom indeks, pandas hanya akan membuat kolom indeks dengan nilai numerik dimulai dari 0:

 #import CSV file without specifying index column
df = pd. read_csv (' my_data.csv ')

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Namun, kita dapat menggunakan argumen index_col untuk menentukan bahwa kolom pertama file CSV harus digunakan sebagai kolom indeks:

 #import CSV file and specify index column
df = pd. read_csv (' my_data.csv ', index_col= 0 )

#view DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Perhatikan bahwa kolom tim sekarang digunakan sebagai kolom indeks.

Contoh 2: Gunakan kolom pertama sebagai indeks dengan DataFrame yang ada

Mari kita asumsikan kita memiliki pandas DataFrame berikut ini:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
df

team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Kita dapat menggunakan fungsi set_index() untuk mengatur kolom tim sebagai kolom indeks:

 #set 'team' column as index column
df = df. set_index ([' team '])

#view updated DataFrame
print (df)

      assist points
team                 
At 18 5
B 22 7
C 19 7
D 14 9
E 14 12
F 11 9
G 20 9
H 28 4

Perhatikan bahwa kolom tim sekarang digunakan sebagai kolom indeks.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara memilih kolom berdasarkan indeks di Pandas DataFrame
Cara mengganti nama indeks di Pandas DataFrame
Cara menghapus kolom berdasarkan indeks di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *