การสุ่มตัวอย่างคลัสเตอร์ใน r: พร้อมตัวอย่าง
นักวิจัยมักจะเก็บ ตัวอย่าง จากประชากรและใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อสรุปผลเกี่ยวกับประชากรโดยรวม
วิธีการสุ่มตัวอย่างที่ใช้กันทั่วไปคือ การสุ่มตัวอย่างแบบคลัสเตอร์ โดยแบ่งประชากรออกเป็นกลุ่มๆ และเลือกสมาชิกทั้งหมดของกลุ่ม บาง กลุ่มเพื่อรวมไว้ในตัวอย่าง
บทช่วยสอนนี้จะอธิบายวิธีการสุ่มตัวอย่างคลัสเตอร์ใน R
ตัวอย่าง: การสุ่มตัวอย่างคลัสเตอร์ใน R
สมมติว่าบริษัทที่ให้บริการทัวร์ชมเมืองต้องการสำรวจลูกค้า จากทัวร์สิบรายการที่พวกเขานำเสนอต่อวัน พวกเขาสุ่มเลือกทัวร์สี่รายการและขอให้ลูกค้าแต่ละรายให้คะแนนประสบการณ์ของตนในระดับ 1 ถึง 10
รหัสต่อไปนี้แสดงวิธีสร้างเฟรมข้อมูลปลอมใน R เพื่อใช้งาน:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
และรหัสต่อไปนี้แสดงวิธีการรับตัวอย่างของลูกค้าโดยการสุ่มเลือกการเข้าชมสี่ครั้ง และรวมสมาชิกแต่ละคนของการเข้าชมเหล่านั้นไว้ในตัวอย่าง:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
จากผลลัพธ์เราจะเห็นได้ว่า:
- ลูกค้า 20 รายจากกลุ่มนักท่องเที่ยว #2 รวมอยู่ในกลุ่มตัวอย่าง
- ลูกค้า 20 รายจากกลุ่มทัวร์หมายเลข 7 รวมอยู่ในกลุ่มตัวอย่าง
- ลูกค้า 20 รายจากกลุ่มทัวร์ #8 รวมอยู่ในกลุ่มตัวอย่าง
- ลูกค้า 20 รายจากกรุ๊ปทัวร์ #10 รวมอยู่ในกลุ่มตัวอย่าง
กลุ่มตัวอย่างนี้ประกอบด้วยลูกค้าทั้งหมด 80 ราย จาก 4 กลุ่มนักท่องเที่ยวที่แตกต่างกัน
ที่เกี่ยวข้อง: วิธีใช้ตัวดำเนินการ %in% ใน R
แหล่งข้อมูลเพิ่มเติม
ทำความเข้าใจวิธีการสุ่มตัวอย่างประเภทต่างๆ
การสุ่มตัวอย่างแบบแบ่งชั้นใน R
การสุ่มตัวอย่างอย่างเป็นระบบใน R