Pandas dataframe'de tek satırlar nasıl seçilir
Pandas DataFrame’de tek satırları seçmek için aşağıdaki sözdizimini kullanabilirsiniz:
df = df. drop_duplicates ()
Ayrıca bir pandas DataFrame’deki belirli sütunlardaki tek satırları seçmek için aşağıdaki sözdizimini kullanabilirsiniz:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Örnek 1: Tüm sütunlardaki benzersiz satırları seçin
Aşağıdaki kod, panda DataFrame’in tüm sütunlarındaki benzersiz satırların nasıl seçileceğini gösterir:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
Birinci ve ikinci satırlar birbirinin kopyası olduğundan pandalar ikinci satırı düşürdü.
Varsayılan olarak drop_duplicates() işlevi ilk kopyayı saklar. Ancak bunun yerine son kopyanın saklanmasını belirtebilirsiniz:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Örnek 2: Belirli sütunlardaki benzersiz satırları seçin
Aşağıdaki kod, DataFrame’in tek “c” sütunundaki tek satırların nasıl seçileceğini gösterir:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
DataFrame’den iki satır kaldırıldı.
Ek kaynaklar
Pandas DataFrame’de satırları dizine göre seçme
Pandas DataFrame’de satır numaraları nasıl alınır?
Pandas’ta bir sütunda benzersiz değerler nasıl bulunur?