Pandas dataframe'de yinelenen satırlar nasıl kaldırılır


Bir pandanın DataFrame’indeki yinelenen satırları kaldırmanın en kolay yolu, aşağıdaki sözdizimini kullanan drop_duplicates() işlevini kullanmaktır:

df.drop_duplicates(subset=Yok, keep=’ilk’, inplace=Yanlış)

Altın:

  • alt küme: kopyaları tanımlamak için hangi sütunların dikkate alınması gerektiği. Varsayılan tüm sütunlardır.
  • Keep: Hangi kopyaların (varsa) saklanacağını belirtir.
    • ilk: İlki dışındaki tüm yinelenen satırları kaldırın.
    • son: sonuncusu dışındaki tüm yinelenen satırları kaldırır.
    • Yanlış : Tüm kopyaları kaldırın.
  • inplace: Yinelenen kopyaların yerinde kaldırılıp kaldırılmayacağını veya DataFrame’in bir kopyasının iade edilip edilmeyeceğini belirtir.

Bu eğitimde, bu işlevin aşağıdaki DataFrame’de pratik kullanımına ilişkin birkaç örnek sunulmaktadır:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({'team': ['a', 'b', 'b', 'c', 'c', 'd'],
                   'points': [3, 7, 7, 8, 8, 9],
                   'assists': [8, 6, 7, 9, 9, 3]})

#display DataFrame
print (df)

  team points assists
0 to 3 8
1 b 7 6
2 b 7 7
3 c 8 9
4 c 8 9
5 d 9 3

Örnek 1: Tüm sütunlardaki kopyaları kaldırın

Aşağıdaki kod, tüm sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:

 df. drop_duplicates ()

        team points assists
0 to 3 8
1 b 7 6
2 b 7 7
3 c 8 9
5 d 9 3

Varsayılan olarak drop_duplicates() işlevi, ilki dışındaki tüm kopyaları kaldırır.

Ancak tüm kopyaları tamamen kaldırmak için keep=False argümanını kullanabiliriz:

 df. drop_duplicates (keep= False )

	team points assists
0 to 3 8
1 b 7 6
2 b 7 7
5 d 9 3

Örnek 2: Belirli sütunlardaki kopyaları kaldırın

Aşağıdaki kod, yalnızca takım ve puan etiketli sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:

 df. drop_duplicates (subset=[' team ', ' points '])

        team points assists
0 to 3 8
1 b 7 6
3 c 8 9
5 d 9 3

Ek kaynaklar

Pandalar’da yinelenen sütunlar nasıl kaldırılır
Pandas DataFrame’deki değerler nasıl sıralanır
Pandas DataFrame’i birden çok koşulda filtreleme
Pandas DataFrame’e sütun nasıl eklenir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir