A: як знайти унікальні рядки в кількох стовпцях


Ви можете використовувати такі методи, щоб знайти унікальні рядки в кількох стовпцях кадру даних у R:

Спосіб 1. Знайдіть унікальні рядки в кількох стовпцях (вилучіть інші стовпці)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Спосіб 2. Знайдіть унікальні рядки в кількох стовпцях (збережіть інші стовпці)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

У наведених нижче прикладах показано, як використовувати кожен із цих методів на практиці з таким кадром даних:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Спосіб 1. Знайдіть унікальні рядки в кількох стовпцях (вилучіть інші стовпці)

Наступний код показує, як знайти унікальні рядки в стовпцях conf і pos кадру даних:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

Результат – чотири унікальні лінії.

Також зауважте, що стовпець балів було автоматично видалено з результатів.

Спосіб 2. Знайдіть окремі рядки в кількох стовпцях (вилучіть інші стовпці)

Наступний код показує, як знайти окремі рядки в стовпцях conf і pos кадру даних і зберегти значення в стовпці points :

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Зверніть увагу, що в стовпцях conf і pos існують лише окремі рядки, а значення в стовпці points зберігаються.

Важливо зазначити, що зберігається лише значення першого унікального входження.

Наприклад, було два рядки, що містили «Схід» і «G» у перших двох стовпцях, але лише значення балів (33) для першого входження цієї унікальної комбінації було збережено в остаточному кадрі даних.

Подібним чином було два рядки, що містили «Захід» і «F» у перших двох стовпцях, але лише значення балів (34) для першого входження цієї унікальної комбінації було збережено в остаточному кадрі даних.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як знайти унікальні значення в стовпці в R
Як підрахувати унікальні значення по групі в R
Як фільтрувати унікальні значення за допомогою dplyr

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *