Cara mendapatkan nama kolom di pandas (3 metode)


Anda dapat menggunakan metode berikut untuk mendapatkan nama kolom di pandas DataFrame:

Metode 1: Dapatkan semua nama kolom

 list (df)

Metode 2: Dapatkan nama kolom berdasarkan abjad

 sorted (df)

Metode 3: Dapatkan nama kolom dengan tipe data tertentu

 list ( df.select_dtypes (include=[' int64 ', ' bool ']))

Contoh berikut menunjukkan cara menggunakan setiap metode dengan pandas DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' playoffs ': [True, False, False, True, True, True]})

#view DataFrame
print (df)

  team points assists playoffs
0 A 18 5 True
1 B 22 7 False
2 C 19 7 False
3 D 14 9 True
4 E 14 12 True
5 F 11 9 True

Contoh 1: Dapatkan semua nama kolom

Cara termudah untuk mendapatkan semua nama kolom di pandas DataFrame adalah dengan menggunakan list() sebagai berikut:

 #get all column names
list (df)

['team', 'points', 'assists', 'playoffs']

Hasilnya adalah daftar yang berisi empat nama kolom pandas DataFrame.

Contoh 2: Dapatkan nama kolom berdasarkan abjad

Untuk mendapatkan nama kolom di pandas DataFrame dalam urutan abjad, Anda dapat menggunakan fungsi sortir() sebagai berikut:

 #get column names in alphabetical order
sorted (df)

['assists', 'playoffs', 'points', 'team']

Hasilnya adalah daftar berisi empat kolom nama panda DataFrame yang diurutkan berdasarkan abjad.

Anda juga dapat menggunakan argumen reverse=True untuk mendapatkan nama kolom dalam urutan abjad terbalik:

 #get column names in reverse alphabetical order
sorted (df, reverse= True )

['team', 'points', 'playoffs', 'assists']

Contoh 3: Dapatkan nama kolom dengan tipe data tertentu

Anda dapat menggunakan sintaks berikut untuk menampilkan tipe data setiap kolom di DataFrame:

 #view data type of each column
df. dtypes

team object
int64 dots
assists int64
playoffs bool
dtype:object

Anda kemudian dapat menggunakan fungsi select_dtypes() untuk hanya mendapatkan nama kolom dengan tipe data tertentu.

Misalnya, kita bisa menggunakan sintaks berikut untuk mendapatkan hanya nama kolom yang memiliki tipe data int64 atau bool :

 #get all columns that have data type of int64 or bool
list ( df.select_dtypes (include=[' int64 ', ' bool ']))

['points', 'assists', 'playoffs']

Hasilnya adalah daftar nama kolom yang memiliki tipe data int64 atau bool .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Pandas: cara mengganti nama kolom
Pandas: Cara mengatur kolom sebagai indeks
Pandas: dapatkan indeks baris yang kolomnya cocok dengan nilainya

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *