Pandas dataframe'de yinelenen satırlar nasıl kaldırılır

İle Dr.benjamin anderson Temmuz 26, 2023 Rehber 0 Yorum

Bir pandanın DataFrame’indeki yinelenen satırları kaldırmanın en kolay yolu, aşağıdaki sözdizimini kullanan drop_duplicates() işlevini kullanmaktır:

df.drop_duplicates(subset=Yok, keep=’ilk’, inplace=Yanlış)

Altın:

alt küme: kopyaları tanımlamak için hangi sütunların dikkate alınması gerektiği. Varsayılan tüm sütunlardır.
Keep: Hangi kopyaların (varsa) saklanacağını belirtir.
- ilk: İlki dışındaki tüm yinelenen satırları kaldırın.
- son: sonuncusu dışındaki tüm yinelenen satırları kaldırır.
- Yanlış : Tüm kopyaları kaldırın.
inplace: Yinelenen kopyaların yerinde kaldırılıp kaldırılmayacağını veya DataFrame’in bir kopyasının iade edilip edilmeyeceğini belirtir.

Bu eğitimde, bu işlevin aşağıdaki DataFrame’de pratik kullanımına ilişkin birkaç örnek sunulmaktadır:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({'team': ['a', 'b', 'b', 'c', 'c', 'd'],
                   'points': [3, 7, 7, 8, 8, 9],
                   'assists': [8, 6, 7, 9, 9, 3]})

#display DataFrame
print (df)

  team points assists
0 to 3 8
1 b 7 6
2 b 7 7
3 c 8 9
4 c 8 9
5 d 9 3

Örnek 1: Tüm sütunlardaki kopyaları kaldırın

Aşağıdaki kod, tüm sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:

 df. drop_duplicates ()

        team points assists
0 to 3 8
1 b 7 6
2 b 7 7
3 c 8 9
5 d 9 3

Varsayılan olarak drop_duplicates() işlevi, ilki dışındaki tüm kopyaları kaldırır.

Ancak tüm kopyaları tamamen kaldırmak için keep=False argümanını kullanabiliriz:

 df. drop_duplicates (keep= False )

	team points assists
0 to 3 8
1 b 7 6
2 b 7 7
5 d 9 3

Örnek 2: Belirli sütunlardaki kopyaları kaldırın

Aşağıdaki kod, yalnızca takım ve puan etiketli sütunlarda yinelenen değerlere sahip satırların nasıl kaldırılacağını gösterir:

 df. drop_duplicates (subset=[' team ', ' points '])

        team points assists
0 to 3 8
1 b 7 6
3 c 8 9
5 d 9 3

Ek kaynaklar

Pandalar’da yinelenen sütunlar nasıl kaldırılır
Pandas DataFrame’deki değerler nasıl sıralanır
Pandas DataFrame’i birden çok koşulda filtreleme
Pandas DataFrame’e sütun nasıl eklenir

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek 1: Tüm sütunlardaki kopyaları kaldırın

Örnek 2: Belirli sütunlardaki kopyaları kaldırın

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle