A: як знайти унікальні рядки в кількох стовпцях
Ви можете використовувати такі методи, щоб знайти унікальні рядки в кількох стовпцях кадру даних у R:
Спосіб 1. Знайдіть унікальні рядки в кількох стовпцях (вилучіть інші стовпці)
df_unique <- unique(df[c(' col1 ', ' col2 ')])
Спосіб 2. Знайдіть унікальні рядки в кількох стовпцях (збережіть інші стовпці)
df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]
У наведених нижче прикладах показано, як використовувати кожен із цих методів на практиці з таким кадром даних:
#create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
pos=c('G', 'G', 'F', 'G', 'F', 'F'),
dots=c(33, 28, 31, 39, 34, 40))
#view data frame
df
conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40
Спосіб 1. Знайдіть унікальні рядки в кількох стовпцях (вилучіть інші стовпці)
Наступний код показує, як знайти унікальні рядки в стовпцях conf і pos кадру даних:
#find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])
#view results
df_unique
conf pos
1 East G
3 East
4 West G
5 West
Результат – чотири унікальні лінії.
Також зауважте, що стовпець балів було автоматично видалено з результатів.
Спосіб 2. Знайдіть окремі рядки в кількох стовпцях (вилучіть інші стовпці)
Наступний код показує, як знайти окремі рядки в стовпцях conf і pos кадру даних і зберегти значення в стовпці points :
#find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]
#view results
df_unique
conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34
Зверніть увагу, що в стовпцях conf і pos існують лише окремі рядки, а значення в стовпці points зберігаються.
Важливо зазначити, що зберігається лише значення першого унікального входження.
Наприклад, було два рядки, що містили «Схід» і «G» у перших двох стовпцях, але лише значення балів (33) для першого входження цієї унікальної комбінації було збережено в остаточному кадрі даних.
Подібним чином було два рядки, що містили «Захід» і «F» у перших двох стовпцях, але лише значення балів (34) для першого входження цієї унікальної комбінації було збережено в остаточному кадрі даних.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як знайти унікальні значення в стовпці в R
Як підрахувати унікальні значення по групі в R
Як фільтрувати унікальні значення за допомогою dplyr