Pandas: menetapkan nama kolom saat mengimpor file csv
Anda dapat menggunakan sintaks dasar berikut untuk menentukan nama kolom DataFrame saat mengimpor file CSV ke pandas:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
Argumen nama mengambil daftar nama yang ingin Anda gunakan untuk kolom di DataFrame.
Dengan menggunakan argumen ini Anda juga memberi tahu panda untuk menggunakan baris pertama file CSV sebagai baris pertama DataFrame alih-alih menggunakannya sebagai baris header.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Tetapkan nama kolom saat mengimpor file CSV ke Pandas
Katakanlah kita memiliki file CSV berikut bernama Players_data.csv :
Dari file tersebut kita dapat melihat bahwa baris pertama tidak berisi nama kolom apa pun.
Jika kita mengimpor file CSV menggunakan fungsi read_csv() , panda akan mencoba menggunakan nilai di baris pertama sebagai nama kolom untuk DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Namun, kita bisa menggunakan argumen nama untuk menentukan nama kolom kita sendiri saat mengimpor file CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Perhatikan bahwa baris pertama file CSV tidak lagi digunakan sebagai baris header.
Sebaliknya, nama kolom yang kita tentukan menggunakan argumen nama sekarang digunakan sebagai nama kolom.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan Python:
Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: cara menggunakan read_csv dengan argumen usecols