Як вибрати окремі рядки у кадрі даних у r
Для вибору окремих рядків у кадрі даних у R можна використовувати такі методи:
Спосіб 1: виберіть окремі рядки в усіх стовпцях
library (dplyr)
df %>% distinct()
Спосіб 2: Виберіть окремі рядки на основі стовпця
library (dplyr)
df %>% distinct(column1, . keep_all = TRUE )
Спосіб 3: Виберіть один рядок на основі кількох стовпців
library (dplyr)
df %>% distinct(column1, column2, . keep_all = TRUE )
Цей підручник пояснює, як використовувати кожен метод на практиці з таким кадром даних:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
points=c(10, 10, 8, 14, 15, 15, 17, 17))
#view data frame
df
team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17
Приклад 1: виберіть унікальні рядки в усіх стовпцях
Наступний код показує, як вибрати рядки з унікальними значеннями в усіх стовпцях у фреймі даних:
library (dplyr)
#select rows with unique values across all columns
df %>% distinct()
team position points
1 AG 10
2AF 8
3 AF 14
4 BG 15
5 BF 17
Ми бачимо, що у кадрі даних є п’ять унікальних рядків.
Примітка . Якщо зустрічаються повторювані рядки, зберігається лише перший унікальний рядок.
Приклад 2: вибір окремих рядків на основі стовпця
Наступний код показує, як вибрати окремі рядки лише на основі стовпця групи .
library (dplyr)
#select rows with unique values based on team column only
df %>% distinct(team, . keep_all = TRUE )
team position points
1 AG 10
2 BG 15
Оскільки в стовпці Team є лише два унікальних значення, зберігаються лише ті рядки, у яких кожне значення зустрічається першим.
Примітка . Аргумент .keep_all=TRUE вказує R зберегти всі інші стовпці у виводі.
Приклад 3: вибір окремих рядків на основі кількох стовпців
Наступний код показує, як вибрати окремі рядки лише на основі стовпців команди та позиції .
library (dplyr)
#select rows with unique values based on team and position columns only
df %>% distinct(team, position, . keep_all = TRUE )
team position points
1 AG 10
2AF 8
3 BG 15
4 BF 17
Повертається чотири рядки, оскільки в стовпцях «Команда » та «Позиція» є чотири унікальні комбінації значень.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як фільтрувати унікальні значення за допомогою dplyr
Як фільтрувати за кількома умовами за допомогою dplyr
Як підрахувати кількість входжень у стовпці в R