Jak wybrać pojedyncze wiersze w ramce danych pandas


Aby wybrać pojedyncze wiersze w ramce DataFrame pandy, możesz użyć następującej składni:

 df = df. drop_duplicates ()

Możesz także użyć następującej składni, aby wybrać pojedyncze wiersze w określonych kolumnach w ramce danych pandy:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Przykład 1: Wybierz unikalne wiersze we wszystkich kolumnach

Poniższy kod pokazuje, jak wybrać unikalne wiersze we wszystkich kolumnach ramki DataFrame pand:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Pierwsza i druga linia były duplikatami, więc pandy porzuciły drugą linię.

Domyślnie funkcja drop_duplicates() zachowa pierwszy duplikat. Zamiast tego możesz jednak określić, czy chcesz zachować ostatni duplikat:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Przykład 2: Wybierz unikalne wiersze w określonych kolumnach

Poniższy kod pokazuje, jak wybrać pojedyncze wiersze w pojedynczej kolumnie „c” ramki DataFrame:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

Z ramki DataFrame usunięto dwa wiersze.

Dodatkowe zasoby

Jak wybierać wiersze według indeksu w ramce danych Pandas
Jak uzyskać numery wierszy w ramce danych Pandas
Jak znaleźć unikalne wartości w kolumnie w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *