أخذ العينات العنقودية في r: مع أمثلة


غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل.

طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات العنقودية ، حيث يتم تقسيم السكان إلى مجموعات ويتم اختيار جميع أعضاء مجموعات معينة لإدراجهم في العينة.

يشرح هذا البرنامج التعليمي كيفية إجراء أخذ العينات العنقودية في R.

مثال: أخذ العينات العنقودية في R

لنفترض أن إحدى الشركات التي تقدم جولات سياحية في المدينة تريد إجراء استطلاع رأي لعملائها. من بين عشر جولات يقدمونها يوميًا، يختارون بشكل عشوائي أربع جولات ويطلبون من كل عميل تقييم تجربته على مقياس من 1 إلى 10.

يوضح التعليمة البرمجية التالية كيفية إنشاء إطار بيانات مزيف في R للعمل معه:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

والكود التالي يوضح كيفية الحصول على عينة من العملاء عن طريق اختيار أربع زيارات عشوائيا وإدراج كل عضو من تلك الزيارات في العينة:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

ومن النتيجة يمكننا أن نرى أن:

  • تم تضمين 20 عميلاً من المجموعة السياحية رقم 2 في العينة.
  • تم تضمين 20 عميلاً من المجموعة السياحية رقم 7 في العينة.
  • تم تضمين 20 عميلاً من المجموعة السياحية رقم 8 في العينة.
  • تم تضمين 20 عميلاً من المجموعة السياحية رقم 10 في العينة.

وبذلك تتكون هذه العينة من 80 عميلاً من 4 مجموعات سياحية مختلفة.

ذات صلة: كيفية استخدام عامل التشغيل %in% في R

مصادر إضافية

التعرف على الأنواع المختلفة لطرق أخذ العينات
أخذ العينات الطبقية في R
أخذ العينات المنهجية في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *