Pandas: cara menggunakan kolom pertama sebagai indeks
Anda dapat menggunakan metode berikut untuk menggunakan kolom pertama sebagai kolom indeks di pandas DataFrame:
Metode 1: Gunakan kolom pertama sebagai indeks saat mengimpor DataFrame
df = pd. read_csv (' my_data.csv ', index_col= 0 )
Metode 2: Gunakan kolom pertama sebagai indeks dengan DataFrame yang ada
df = df. set_index ([' column1 '])
Contoh berikut menunjukkan cara menggunakan masing-masing metode dalam praktik.
Contoh 1: Gunakan kolom pertama sebagai indeks saat mengimpor DataFrame
Katakanlah kita memiliki file CSV berikut bernama my_data.csv :
Jika kita mengimpor file CSV tanpa menentukan kolom indeks, pandas hanya akan membuat kolom indeks dengan nilai numerik dimulai dari 0:
#import CSV file without specifying index column df = pd. read_csv (' my_data.csv ') #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Namun, kita dapat menggunakan argumen index_col untuk menentukan bahwa kolom pertama file CSV harus digunakan sebagai kolom indeks:
#import CSV file and specify index column df = pd. read_csv (' my_data.csv ', index_col= 0 ) #view DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Perhatikan bahwa kolom tim sekarang digunakan sebagai kolom indeks.
Contoh 2: Gunakan kolom pertama sebagai indeks dengan DataFrame yang ada
Mari kita asumsikan kita memiliki pandas DataFrame berikut ini:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}) #view DataFrame df team points assists 0 to 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7:28 a.m. 4
Kita dapat menggunakan fungsi set_index() untuk mengatur kolom tim sebagai kolom indeks:
#set 'team' column as index column df = df. set_index ([' team ']) #view updated DataFrame print (df) assist points team At 18 5 B 22 7 C 19 7 D 14 9 E 14 12 F 11 9 G 20 9 H 28 4
Perhatikan bahwa kolom tim sekarang digunakan sebagai kolom indeks.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Cara memilih kolom berdasarkan indeks di Pandas DataFrame
Cara mengganti nama indeks di Pandas DataFrame
Cara menghapus kolom berdasarkan indeks di Pandas