การสุ่มตัวอย่างคลัสเตอร์ใน r: พร้อมตัวอย่าง


นักวิจัยมักจะเก็บ ตัวอย่าง จากประชากรและใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อสรุปผลเกี่ยวกับประชากรโดยรวม

วิธีการสุ่มตัวอย่างที่ใช้กันทั่วไปคือ การสุ่มตัวอย่างแบบคลัสเตอร์ โดยแบ่งประชากรออกเป็นกลุ่มๆ และเลือกสมาชิกทั้งหมดของกลุ่ม บาง กลุ่มเพื่อรวมไว้ในตัวอย่าง

บทช่วยสอนนี้จะอธิบายวิธีการสุ่มตัวอย่างคลัสเตอร์ใน R

ตัวอย่าง: การสุ่มตัวอย่างคลัสเตอร์ใน R

สมมติว่าบริษัทที่ให้บริการทัวร์ชมเมืองต้องการสำรวจลูกค้า จากทัวร์สิบรายการที่พวกเขานำเสนอต่อวัน พวกเขาสุ่มเลือกทัวร์สี่รายการและขอให้ลูกค้าแต่ละรายให้คะแนนประสบการณ์ของตนในระดับ 1 ถึง 10

รหัสต่อไปนี้แสดงวิธีสร้างเฟรมข้อมูลปลอมใน R เพื่อใช้งาน:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

และรหัสต่อไปนี้แสดงวิธีการรับตัวอย่างของลูกค้าโดยการสุ่มเลือกการเข้าชมสี่ครั้ง และรวมสมาชิกแต่ละคนของการเข้าชมเหล่านั้นไว้ในตัวอย่าง:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ลูกค้า 20 รายจากกลุ่มนักท่องเที่ยว #2 รวมอยู่ในกลุ่มตัวอย่าง
  • ลูกค้า 20 รายจากกลุ่มทัวร์หมายเลข 7 รวมอยู่ในกลุ่มตัวอย่าง
  • ลูกค้า 20 รายจากกลุ่มทัวร์ #8 รวมอยู่ในกลุ่มตัวอย่าง
  • ลูกค้า 20 รายจากกรุ๊ปทัวร์ #10 รวมอยู่ในกลุ่มตัวอย่าง

กลุ่มตัวอย่างนี้ประกอบด้วยลูกค้าทั้งหมด 80 ราย จาก 4 กลุ่มนักท่องเที่ยวที่แตกต่างกัน

ที่เกี่ยวข้อง: วิธีใช้ตัวดำเนินการ %in% ใน R

แหล่งข้อมูลเพิ่มเติม

ทำความเข้าใจวิธีการสุ่มตัวอย่างประเภทต่างๆ
การสุ่มตัวอย่างแบบแบ่งชั้นใน R
การสุ่มตัวอย่างอย่างเป็นระบบใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *