Pandalarda yinelenen sütunlar nasıl kaldırılır (örneklerle)


Pandalarda yinelenen sütunları kaldırmak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. T. drop_duplicates (). T

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Örnek: Pandalarda Yinelenen Sütunları Kaldırma

Aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Yinelenen “noktalar” sütununu kaldırmak için aşağıdaki kodu kullanabiliriz:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Diğer tüm sütunlar DataFrame’de kalırken “noktalar” sütununun kaldırıldığını unutmayın.

Ayrıca, bu kodun, sütunlar farklı adlara sahip olsa ancak aynı değerleri içerse bile yinelenen sütunları kaldıracağını da belirtmekte fayda var.

Örneğin, aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

“points” ve “points2” sütunlarının aynı değerleri içerdiğini unutmayın.

Yinelenen ‘points2’ sütununu kaldırmak için aşağıdaki kodu kullanabiliriz:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandas DataFrame’de yinelenen satırlar nasıl kaldırılır
Pandalar’daki sütunlar nasıl silinir
Pandalar’da sütunlar nasıl hariç tutulur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir