Pandalar: birden fazla sütundaki kopyalar nasıl kaldırılır


Bir pandas DataFrame’de birden çok sütundaki yinelenen satırları kaldırmak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Tüm sütunlardaki kopyaları kaldırın

 df. drop_duplicates ()

Yöntem 2: Belirli sütunlardaki kopyaları kaldırın

 df. drop_duplicates ([' column1 ',' column3 '])

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'],
                   ' store ': [1, 1, 2, 1, 2, 2],
                   ' sales ': [5, 5, 7, 9, 12, 8]})

#view DataFrame
print (df)

  region store sales
0 East 1 5
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

Örnek 1: Tüm sütunlardaki kopyaları kaldırın

Aşağıdaki kod, tüm sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:

 #drop rows that have duplicate values across all columns
df. drop_duplicates ()

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

Dizin konumu 1’deki satır, tüm sütunlarda dizin konumu 0’daki satırla aynı değerlere sahipti, bu nedenle DataFrame’den kaldırıldı.

Varsayılan olarak pandalar ilk satırı kopya olarak tutar. Ancak, son yinelenen satırın tutulacağını belirtmek için keep argümanını kullanabilirsiniz:

 #drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')

	region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

Örnek 2: Belirli sütunlardaki kopyaları kaldırın

Yalnızca bölgede yinelenen değerlere sahip satırları kaldırmak ve sütunları saklamak için aşağıdaki kodu kullanabilirsiniz:

 #drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12

Toplamda iki satır, Bölge ve Mağaza sütunlarında yinelenen değerler içerdiğinden DataFrame’den kaldırıldı.

Not : drop_duplicates() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda kopyalar nasıl bulunur?
Pandalar’da yinelenen sütunlar nasıl kaldırılır
Pandas DataFrame’de ilk satır nasıl kaldırılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir