วิธีเลือกเส้นสุ่มใน r โดยใช้ dplyr


คุณสามารถใช้วิธีการต่อไปนี้เพื่อเลือกแถวสุ่มในกรอบข้อมูลใน R โดยใช้ฟังก์ชันในแพ็คเกจ dplyr :

วิธีที่ 1: เลือกจำนวนแถวแบบสุ่ม

 df %>% sample_n( 5 )

ฟังก์ชั่นนี้จะสุ่มเลือก 5 แถวจากกรอบข้อมูล

วิธีที่ 2: เลือกเศษส่วนแบบสุ่มของแถว

 df %>% sample_frac( .25 )

ฟังก์ชั่นนี้จะสุ่มเลือก 25% ของแถวทั้งหมดในกรอบข้อมูล

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้ใน R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

ตัวอย่างที่ 1: เลือกจำนวนแถวแบบสุ่ม

เราสามารถใช้โค้ดต่อไปนี้เพื่อสุ่มเลือก 5 แถวจาก data frame:

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

โปรดทราบว่าจะมีการสุ่มเลือกห้าแถวจากกรอบข้อมูล

ตัวอย่างที่ 2: เลือกเศษส่วนแบบสุ่มของแถว

เราสามารถใช้โค้ดต่อไปนี้เพื่อสุ่มเลือก 25% ของแถวทั้งหมดใน data frame:

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

เนื่องจากกรอบข้อมูลดั้งเดิมมีค่าทั้งหมด 8 ค่า 25% ของ 8 จึงเท่ากับ 2

ดังนั้นจึงสุ่มเลือกสองแถวจากกรอบข้อมูล

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน example_n และ example_frac ใน dplyr ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ใน dplyr:

วิธีเลือกคอลัมน์ตามดัชนีโดยใช้ dplyr
วิธีเลือกแถวแรกตามกลุ่มโดยใช้ dplyr
วิธีกรองตามเงื่อนไขต่างๆ โดยใช้ dplyr
วิธีกรองแถวที่มีสตริงบางตัวโดยใช้ dplyr

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *