Pandalar: birden fazla sütundaki kopyalar nasıl kaldırılır
Bir pandas DataFrame’de birden çok sütundaki yinelenen satırları kaldırmak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Tüm sütunlardaki kopyaları kaldırın
df. drop_duplicates ()
Yöntem 2: Belirli sütunlardaki kopyaları kaldırın
df. drop_duplicates ([' column1 ',' column3 '])
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'], ' store ': [1, 1, 2, 1, 2, 2], ' sales ': [5, 5, 7, 9, 12, 8]}) #view DataFrame print (df) region store sales 0 East 1 5 1 East 1 5 2 East 2 7 3 West 1 9 4 West 2 12 5 West 2 8
Örnek 1: Tüm sütunlardaki kopyaları kaldırın
Aşağıdaki kod, tüm sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:
#drop rows that have duplicate values across all columns
df. drop_duplicates ()
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
Dizin konumu 1’deki satır, tüm sütunlarda dizin konumu 0’daki satırla aynı değerlere sahipti, bu nedenle DataFrame’den kaldırıldı.
Varsayılan olarak pandalar ilk satırı kopya olarak tutar. Ancak, son yinelenen satırın tutulacağını belirtmek için keep argümanını kullanabilirsiniz:
#drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')
region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
Örnek 2: Belirli sütunlardaki kopyaları kaldırın
Yalnızca bölgede yinelenen değerlere sahip satırları kaldırmak ve sütunları saklamak için aşağıdaki kodu kullanabilirsiniz:
#drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
Toplamda iki satır, Bölge ve Mağaza sütunlarında yinelenen değerler içerdiğinden DataFrame’den kaldırıldı.
Not : drop_duplicates() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda kopyalar nasıl bulunur?
Pandalar’da yinelenen sütunlar nasıl kaldırılır
Pandas DataFrame’de ilk satır nasıl kaldırılır