Pandas dataframe'de tek satırlar nasıl seçilir


Pandas DataFrame’de tek satırları seçmek için aşağıdaki sözdizimini kullanabilirsiniz:

 df = df. drop_duplicates ()

Ayrıca bir pandas DataFrame’deki belirli sütunlardaki tek satırları seçmek için aşağıdaki sözdizimini kullanabilirsiniz:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Örnek 1: Tüm sütunlardaki benzersiz satırları seçin

Aşağıdaki kod, panda DataFrame’in tüm sütunlarındaki benzersiz satırların nasıl seçileceğini gösterir:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Birinci ve ikinci satırlar birbirinin kopyası olduğundan pandalar ikinci satırı düşürdü.

Varsayılan olarak drop_duplicates() işlevi ilk kopyayı saklar. Ancak bunun yerine son kopyanın saklanmasını belirtebilirsiniz:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Örnek 2: Belirli sütunlardaki benzersiz satırları seçin

Aşağıdaki kod, DataFrame’in tek “c” sütunundaki tek satırların nasıl seçileceğini gösterir:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

DataFrame’den iki satır kaldırıldı.

Ek kaynaklar

Pandas DataFrame’de satırları dizine göre seçme
Pandas DataFrame’de satır numaraları nasıl alınır?
Pandas’ta bir sütunda benzersiz değerler nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir