Як фільтрувати унікальні значення за допомогою dplyr


Ви можете використовувати такі методи для фільтрації унікальних значень у кадрі даних у R за допомогою пакета dplyr :

Спосіб 1: фільтруйте унікальні значення в стовпці

 df %>% distinct(var1)

Спосіб 2: фільтруйте унікальні значення в кількох стовпцях

 df %>% distinct(var1, var2)

Спосіб 3: фільтруйте унікальні значення у всіх стовпцях

 df %>% distinct()

У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким кадром даних у R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Приклад 1: Фільтр унікальних значень у стовпці

Ми можемо використовувати наступний код для фільтрації унікальних значень лише в стовпці team :

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Зверніть увагу, що повертаються лише унікальні значення зі стовпця team .

Приклад 2: фільтруйте унікальні значення в кількох стовпцях

Ми можемо використовувати наступний код для фільтрації унікальних значень у стовпцях команди та балів :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Зауважте, що повертаються лише унікальні значення зі стовпців команди та балів .

Приклад 3: Фільтр унікальних значень у всіх стовпцях

Ми можемо використовувати наступний код для фільтрації унікальних значень по всіх стовпцях у фреймі даних:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Зверніть увагу, що повертаються унікальні значення з усіх трьох стовпців.

Примітка : ви можете знайти повну документацію окремої функції в dplyr тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в dplyr:

Як вибрати стовпці за індексом за допомогою dplyr
Як вибрати перший рядок групою за допомогою dplyr
Як фільтрувати за кількома умовами за допомогою dplyr
Як фільтрувати рядки, що містять певний рядок, за допомогою dplyr

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *