如何使用dplyr过滤唯一值


您可以使用以下方法使用dplyr包来过滤 R 中数据框中的唯一值:

方法一:过滤列中的唯一值

 df %>% distinct(var1)

方法2:过滤多列中的唯一值

 df %>% distinct(var1, var2)

方法3:过滤所有列中的唯一值

 df %>% distinct()

以下示例展示了如何在 R 中使用以下数据框实际使用每种方法:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

示例1:过滤列中的唯一值

我们可以使用以下代码来过滤仅在团队列中的唯一值:

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

请注意,仅返回团队列中的唯一值。

示例2:过滤多列中的唯一值

我们可以使用以下代码来过滤球队积分列中的唯一值:

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

请注意,仅返回团队积分列中的唯一值。

示例3:过滤所有列中的唯一值

我们可以使用以下代码来过滤数据框中所有列的唯一值:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

请注意,返回所有三列的唯一值。

注意:您可以在 dplyr找到该单独函数的完整文档。

其他资源

以下教程解释了如何在 dplyr 中执行其他常见操作:

如何使用 dplyr 按索引选择列
如何使用 dplyr 按组选择第一行
如何使用 dplyr 按多个条件进行过滤
如何使用 dplyr 过滤包含特定字符串的行

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注