Как выбрать отдельные строки в dataframe pandas
Вы можете использовать следующий синтаксис для выбора отдельных строк в DataFrame pandas:
df = df. drop_duplicates ()
И вы можете использовать следующий синтаксис для выбора отдельных строк в определенных столбцах в DataFrame pandas:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
В следующих примерах показано, как использовать этот синтаксис на практике со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Пример 1. Выбор уникальных строк во всех столбцах
Следующий код показывает, как выбрать уникальные строки во всех столбцах DataFrame pandas:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
Первая и вторая строки были дубликатами, поэтому панды удалили вторую строку.
По умолчанию функция drop_duulates() сохраняет первый дубликат. Однако вы можете указать вместо этого сохранить последний дубликат:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Пример 2. Выбор уникальных строк в определенных столбцах
Следующий код показывает, как выбрать отдельные строки в одном столбце «c» DataFrame:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
Две строки были удалены из DataFrame.
Дополнительные ресурсы
Как выбрать строки по индексу в DataFrame Pandas
Как получить номера строк в DataFrame Pandas
Как найти уникальные значения в столбце в Pandas