Cara menghapus kolom duplikat di pandas (dengan contoh)
Anda dapat menggunakan sintaks dasar berikut untuk menghapus kolom duplikat di panda:
df. T. drop_duplicates (). T
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Hapus Kolom Duplikat di Pandas
Misalkan kita memiliki panda DataFrame berikut:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) df. columns = ['team', 'points', 'points', 'rebounds'] #view DataFrame df team points points rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Kita dapat menggunakan kode berikut untuk menghapus kolom “poin” duplikat:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Perhatikan bahwa kolom “poin” telah dihapus sementara semua kolom lainnya tetap berada di DataFrame.
Perlu juga dicatat bahwa kode ini akan menghapus kolom duplikat meskipun kolom tersebut memiliki nama berbeda, tetapi berisi nilai yang sama.
Misalnya, kita memiliki DataFrame panda berikut:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team points points2 rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Perhatikan bahwa kolom “poin” dan “poin2” berisi nilai yang identik.
Kita dapat menggunakan kode berikut untuk menghapus kolom duplikat ‘poin2’:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Sumber daya tambahan
Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di panda:
Cara menghapus baris duplikat di Pandas DataFrame
Cara menghapus kolom di Pandas
Cara mengecualikan kolom di Pandas