أخذ العينات العنقودية في r: مع أمثلة
غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل.
طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات العنقودية ، حيث يتم تقسيم السكان إلى مجموعات ويتم اختيار جميع أعضاء مجموعات معينة لإدراجهم في العينة.
يشرح هذا البرنامج التعليمي كيفية إجراء أخذ العينات العنقودية في R.
مثال: أخذ العينات العنقودية في R
لنفترض أن إحدى الشركات التي تقدم جولات سياحية في المدينة تريد إجراء استطلاع رأي لعملائها. من بين عشر جولات يقدمونها يوميًا، يختارون بشكل عشوائي أربع جولات ويطلبون من كل عميل تقييم تجربته على مقياس من 1 إلى 10.
يوضح التعليمة البرمجية التالية كيفية إنشاء إطار بيانات مزيف في R للعمل معه:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
والكود التالي يوضح كيفية الحصول على عينة من العملاء عن طريق اختيار أربع زيارات عشوائيا وإدراج كل عضو من تلك الزيارات في العينة:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
ومن النتيجة يمكننا أن نرى أن:
- تم تضمين 20 عميلاً من المجموعة السياحية رقم 2 في العينة.
- تم تضمين 20 عميلاً من المجموعة السياحية رقم 7 في العينة.
- تم تضمين 20 عميلاً من المجموعة السياحية رقم 8 في العينة.
- تم تضمين 20 عميلاً من المجموعة السياحية رقم 10 في العينة.
وبذلك تتكون هذه العينة من 80 عميلاً من 4 مجموعات سياحية مختلفة.
ذات صلة: كيفية استخدام عامل التشغيل %in% في R
مصادر إضافية
التعرف على الأنواع المختلفة لطرق أخذ العينات
أخذ العينات الطبقية في R
أخذ العينات المنهجية في R