Как выбрать отдельные строки в dataframe pandas


Вы можете использовать следующий синтаксис для выбора отдельных строк в DataFrame pandas:

 df = df. drop_duplicates ()

И вы можете использовать следующий синтаксис для выбора отдельных строк в определенных столбцах в DataFrame pandas:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

В следующих примерах показано, как использовать этот синтаксис на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Пример 1. Выбор уникальных строк во всех столбцах

Следующий код показывает, как выбрать уникальные строки во всех столбцах DataFrame pandas:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Первая и вторая строки были дубликатами, поэтому панды удалили вторую строку.

По умолчанию функция drop_duulates() сохраняет первый дубликат. Однако вы можете указать вместо этого сохранить последний дубликат:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Пример 2. Выбор уникальных строк в определенных столбцах

Следующий код показывает, как выбрать отдельные строки в одном столбце «c» DataFrame:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

Две строки были удалены из DataFrame.

Дополнительные ресурсы

Как выбрать строки по индексу в DataFrame Pandas
Как получить номера строк в DataFrame Pandas
Как найти уникальные значения в столбце в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *