Jak wybrać pojedyncze wiersze w ramce danych pandas
Aby wybrać pojedyncze wiersze w ramce DataFrame pandy, możesz użyć następującej składni:
df = df. drop_duplicates ()
Możesz także użyć następującej składni, aby wybrać pojedyncze wiersze w określonych kolumnach w ramce danych pandy:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Przykład 1: Wybierz unikalne wiersze we wszystkich kolumnach
Poniższy kod pokazuje, jak wybrać unikalne wiersze we wszystkich kolumnach ramki DataFrame pand:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
Pierwsza i druga linia były duplikatami, więc pandy porzuciły drugą linię.
Domyślnie funkcja drop_duplicates() zachowa pierwszy duplikat. Zamiast tego możesz jednak określić, czy chcesz zachować ostatni duplikat:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Przykład 2: Wybierz unikalne wiersze w określonych kolumnach
Poniższy kod pokazuje, jak wybrać pojedyncze wiersze w pojedynczej kolumnie „c” ramki DataFrame:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
Z ramki DataFrame usunięto dwa wiersze.
Dodatkowe zasoby
Jak wybierać wiersze według indeksu w ramce danych Pandas
Jak uzyskać numery wierszy w ramce danych Pandas
Jak znaleźć unikalne wartości w kolumnie w Pandach