如何使用dplyr过滤唯一值
您可以使用以下方法使用dplyr包来过滤 R 中数据框中的唯一值:
方法一:过滤列中的唯一值
df %>% distinct(var1)
方法2:过滤多列中的唯一值
df %>% distinct(var1, var2)
方法3:过滤所有列中的唯一值
df %>% distinct()
以下示例展示了如何在 R 中使用以下数据框实际使用每种方法:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7
示例1:过滤列中的唯一值
我们可以使用以下代码来过滤仅在团队列中的唯一值:
library (dplyr)
#select only unique values in team column
df %>% distinct(team)
team
1A
2 B
请注意,仅返回团队列中的唯一值。
示例2:过滤多列中的唯一值
我们可以使用以下代码来过滤球队和积分列中的唯一值:
library (dplyr)
#select unique values in team and points columns
df %>% distinct(team, points)
team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12
请注意,仅返回团队和积分列中的唯一值。
示例3:过滤所有列中的唯一值
我们可以使用以下代码来过滤数据框中所有列的唯一值:
library (dplyr)
#select unique values across all columns
df %>% distinct()
team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7
请注意,返回所有三列的唯一值。
注意:您可以在 dplyr中找到该单独函数的完整文档。
其他资源
以下教程解释了如何在 dplyr 中执行其他常见操作:
如何使用 dplyr 按索引选择列
如何使用 dplyr 按组选择第一行
如何使用 dplyr 按多个条件进行过滤
如何使用 dplyr 过滤包含特定字符串的行