Cara memeriksa apakah ada kolom di pandas (dengan contoh)


Anda dapat menggunakan metode berikut untuk memeriksa apakah ada kolom di pandas DataFrame:

Metode 1: Periksa apakah ada kolom

 ' column1 ' in df. columns

Ini akan mengembalikan True jika “column1” ada di DataFrame, jika tidak maka akan mengembalikan False .

Metode 2: Periksa apakah ada beberapa kolom

 {' column1 ', ' column2 '}. issubset ( df.columns )

Ini akan mengembalikan True jika “column1” dan “column2” ada di DataFrame, jika tidak maka akan mengembalikan False .

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan pandas DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Contoh 1: Periksa apakah ada kolom

Kita dapat menggunakan kode berikut untuk melihat apakah kolom ‘tim’ ada di DataFrame:

 #check if 'team' column exists in DataFrame
' team ' in df. columns

True

Kolom “tim” ada di DataFrame, jadi panda mengembalikan nilai True .

Kita juga bisa menggunakan pernyataan if untuk melakukan operasi jika kolom “tim” ada:

 #if 'team' exists, create new column called 'team_name'
if ' team ' in df. columns :
    df[' team_name '] = df[' team ']
    
#view updated DataFrame
print (df)

  team points assists rebounds team_name
0 A 18 5 11 A
1 B 22 7 8 B
2 C 19 7 10 C
3 D 14 9 6 D
4 E 14 12 6 E
5 F 11 9 5 F
6 G 20 9 9 G
7:28 a.m. 4:12 p.m.

Contoh 2: Periksa apakah ada beberapa kolom

Kita dapat menggunakan kode berikut untuk melihat apakah kolom ‘tim’ dan ‘pemain’ ada di DataFrame:

 #check if 'team' and 'player' columns both exist in DataFrame
{' team ', ' player '}. issubset ( df.columns )

False

Kolom ‘tim’ ada di DataFrame tetapi ‘pemain’ tidak, jadi panda mengembalikan nilai False .

Kita juga bisa menggunakan kode berikut untuk melihat apakah “poin” dan “bantuan” ada di DataFrame:

 #check if 'points' and 'assists' columns both exist in DataFrame
{' points ', ' assists '}. issubset ( df.columns )

True

Kedua kolom tersebut ada, sehingga panda mengembalikan nilai True .

Kita kemudian dapat menggunakan pernyataan if untuk melakukan operasi jika “titik” dan “pembantu” ada:

 #if both exist, create new column called 'total' that finds sum of points and assists
if {' points ', ' assists '}. issubset ( df.columns ):
    df[' total '] = df[' points '] + df[' assists ']
    
#view updated DataFrame
print (df)

     team points assists rebounds total
0 A 18 5 11 23
1 B 22 7 8 29
2 C 19 7 10 26
3 D 14 9 6 23
4 E 14 12 6 26
5 F 11 9 5 20
6 G 20 9 9 29
7:28 4 12 32

Karena “poin” dan “bantuan” ada di DataFrame, pandas membuat kolom baru bernama “total” yang menunjukkan jumlah kolom “poin” dan “bantuan”.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Bagaimana cara mempertahankan kolom tertentu di Pandas
Cara memilih kolom berdasarkan indeks di Pandas
Cara memindahkan kolom di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *