Як вибрати окремі рядки в pandas dataframe
Ви можете використовувати наступний синтаксис для вибору окремих рядків у pandas DataFrame:
df = df. drop_duplicates ()
І ви можете використовувати наступний синтаксис, щоб вибрати окремі рядки в певних стовпцях у pandas DataFrame:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
Наступні приклади показують, як використовувати цей синтаксис на практиці з наступними pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
Приклад 1: виберіть унікальні рядки в усіх стовпцях
Наступний код показує, як вибрати унікальні рядки в усіх стовпцях pandas DataFrame:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
Перший і другий рядки були дублікатами, тому панди випустили другий рядок.
За замовчуванням функція drop_duplicates() збереже перший дублікат. Однак ви можете вказати, щоб замість цього залишився останній дублікат:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
Приклад 2: виберіть унікальні рядки в певних стовпцях
Наступний код показує, як вибрати окремі рядки в одному стовпці “c” DataFrame:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
З DataFrame видалено два рядки.
Додаткові ресурси
Як вибрати рядки за індексом у Pandas DataFrame
Як отримати номери рядків у Pandas DataFrame
Як знайти унікальні значення в стовпці в Pandas