Як вибрати окремі рядки в pandas dataframe


Ви можете використовувати наступний синтаксис для вибору окремих рядків у pandas DataFrame:

 df = df. drop_duplicates ()

І ви можете використовувати наступний синтаксис, щоб вибрати окремі рядки в певних стовпцях у pandas DataFrame:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

Наступні приклади показують, як використовувати цей синтаксис на практиці з наступними pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

Приклад 1: виберіть унікальні рядки в усіх стовпцях

Наступний код показує, як вибрати унікальні рядки в усіх стовпцях pandas DataFrame:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

Перший і другий рядки були дублікатами, тому панди випустили другий рядок.

За замовчуванням функція drop_duplicates() збереже перший дублікат. Однак ви можете вказати, щоб замість цього залишився останній дублікат:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

Приклад 2: виберіть унікальні рядки в певних стовпцях

Наступний код показує, як вибрати окремі рядки в одному стовпці “c” DataFrame:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

З DataFrame видалено два рядки.

Додаткові ресурси

Як вибрати рядки за індексом у Pandas DataFrame
Як отримати номери рядків у Pandas DataFrame
Як знайти унікальні значення в стовпці в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *