Pandas: abaikan kolom pertama saat mengimpor file csv


Anda dapat menggunakan sintaks dasar berikut untuk mengabaikan kolom pertama saat mengimpor file CSV ke pandas DataFrame:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

Contoh khusus ini akan membaca setiap kolom file CSV bernama basket_data.csv menjadi DataFrame pandas, kecuali kolom pertama.

Dengan menggunakan kode ini, pertama-tama kita mencari jumlah kolom dalam file CSV dan menetapkannya ke variabel bernama ncols .

Selanjutnya, kita menggunakan argumen usecols untuk menentukan bahwa kita hanya ingin mengimpor kolom antara 1 (yaitu kolom kedua) dan kolom terakhir file CSV.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Abaikan kolom pertama saat mengimpor file CSV ke Pandas

Katakanlah kita memiliki file CSV berikut bernama basket_data.csv :

Kita dapat menggunakan sintaks berikut untuk mengimpor file CSV ke pandas DataFrame dan mengabaikan kolom pertama:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Perhatikan bahwa kolom pertama bernama team telah dihapus saat kami mengimpor file CSV ke pandas.

Perhatikan bahwa jika Anda sudah mengetahui jumlah total kolom dalam file CSV sebelumnya, Anda bisa langsung memasukkan nilai ini ke argumen usecols .

Misalnya kita sudah mengetahui bahwa ada tiga kolom di file CVS.

Kita bisa menggunakan sintaks berikut untuk mengimpor file CSV ke pandas DataFrame dan mengabaikan kolom pertama:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Perhatikan bahwa kolom pertama bernama team telah dihapus saat kami mengimpor file CSV ke pandas.

Karena kita sudah mengetahui ada tiga kolom dalam file CSV, kita cukup menggunakan range(1,3) dalam argumen usecols .

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan Python:

Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: cara menggunakan read_csv dengan argumen usecols

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *