Cara menghapus kolom duplikat di pandas (dengan contoh)


Anda dapat menggunakan sintaks dasar berikut untuk menghapus kolom duplikat di panda:

 df. T. drop_duplicates (). T

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Hapus Kolom Duplikat di Pandas

Misalkan kita memiliki panda DataFrame berikut:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Kita dapat menggunakan kode berikut untuk menghapus kolom “poin” duplikat:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Perhatikan bahwa kolom “poin” telah dihapus sementara semua kolom lainnya tetap berada di DataFrame.

Perlu juga dicatat bahwa kode ini akan menghapus kolom duplikat meskipun kolom tersebut memiliki nama berbeda, tetapi berisi nilai yang sama.

Misalnya, kita memiliki DataFrame panda berikut:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Perhatikan bahwa kolom “poin” dan “poin2” berisi nilai yang identik.

Kita dapat menggunakan kode berikut untuk menghapus kolom duplikat ‘poin2’:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Sumber daya tambahan

Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di panda:

Cara menghapus baris duplikat di Pandas DataFrame
Cara menghapus kolom di Pandas
Cara mengecualikan kolom di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *