วิธีกรองค่าที่ไม่ซ้ำโดยใช้ dplyr


คุณสามารถใช้วิธีการต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำใน data frame ใน R โดยใช้แพ็คเกจ dplyr :

วิธีที่ 1: กรองค่าที่ไม่ซ้ำในคอลัมน์

 df %>% distinct(var1)

วิธีที่ 2: กรองค่าที่ไม่ซ้ำในหลายคอลัมน์

 df %>% distinct(var1, var2)

วิธีที่ 3: กรองค่าที่ไม่ซ้ำในทุกคอลัมน์

 df %>% distinct()

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้ใน R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

ตัวอย่างที่ 1: กรองค่าที่ไม่ซ้ำในคอลัมน์

เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำเฉพาะในคอลัมน์ ทีม เท่านั้น:

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

โปรดทราบว่าจะส่งคืนค่าเฉพาะจากคอลัมน์ ทีม เท่านั้น

ตัวอย่างที่ 2: กรองค่าที่ไม่ซ้ำในหลายคอลัมน์

เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำในคอลัมน์ ทีม และ คะแนน :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

โปรดทราบว่าจะส่งคืนค่าเฉพาะจากคอลัมน์ ทีม และ คะแนน เท่านั้น

ตัวอย่างที่ 3: กรองค่าที่ไม่ซ้ำในทุกคอลัมน์

เราสามารถใช้โค้ดต่อไปนี้เพื่อกรองค่าที่ไม่ซ้ำในทุกคอลัมน์ใน data frame:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

โปรดทราบว่าจะมีการส่งคืนค่าที่ไม่ซ้ำจากทั้งสามคอลัมน์

หมายเหตุ : คุณสามารถค้นหาเอกสารฉบับเต็มของฟังก์ชัน แยกต่างหากได้ ใน dplyr ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ใน dplyr:

วิธีเลือกคอลัมน์ตามดัชนีโดยใช้ dplyr
วิธีเลือกแถวแรกตามกลุ่มโดยใช้ dplyr
วิธีกรองตามเงื่อนไขต่างๆ โดยใช้ dplyr
วิธีกรองแถวที่มีสตริงบางตัวโดยใช้ dplyr

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *