วิธีกรองค่าที่ไม่ซ้ำโดยใช้ dplyr
คุณสามารถใช้วิธีการต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำใน data frame ใน R โดยใช้แพ็คเกจ dplyr :
วิธีที่ 1: กรองค่าที่ไม่ซ้ำในคอลัมน์
df %>% distinct(var1)
วิธีที่ 2: กรองค่าที่ไม่ซ้ำในหลายคอลัมน์
df %>% distinct(var1, var2)
วิธีที่ 3: กรองค่าที่ไม่ซ้ำในทุกคอลัมน์
df %>% distinct()
ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้ใน R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7
ตัวอย่างที่ 1: กรองค่าที่ไม่ซ้ำในคอลัมน์
เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำเฉพาะในคอลัมน์ ทีม เท่านั้น:
library (dplyr)
#select only unique values in team column
df %>% distinct(team)
team
1A
2 B
โปรดทราบว่าจะส่งคืนค่าเฉพาะจากคอลัมน์ ทีม เท่านั้น
ตัวอย่างที่ 2: กรองค่าที่ไม่ซ้ำในหลายคอลัมน์
เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำในคอลัมน์ ทีม และ คะแนน :
library (dplyr)
#select unique values in team and points columns
df %>% distinct(team, points)
team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12
โปรดทราบว่าจะส่งคืนค่าเฉพาะจากคอลัมน์ ทีม และ คะแนน เท่านั้น
ตัวอย่างที่ 3: กรองค่าที่ไม่ซ้ำในทุกคอลัมน์
เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำในทุกคอลัมน์ใน data frame:
library (dplyr)
#select unique values across all columns
df %>% distinct()
team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7
โปรดทราบว่าจะมีการส่งคืนค่าที่ไม่ซ้ำจากทั้งสามคอลัมน์
หมายเหตุ : คุณสามารถค้นหาเอกสารฉบับเต็มของฟังก์ชัน แยกต่างหากได้ ใน dplyr ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ใน dplyr:
วิธีเลือกคอลัมน์ตามดัชนีโดยใช้ dplyr
วิธีเลือกแถวแรกตามกลุ่มโดยใช้ dplyr
วิธีกรองตามเงื่อนไขต่างๆ โดยใช้ dplyr
วิธีกรองแถวที่มีสตริงบางตัวโดยใช้ dplyr