أخذ العينات المنهجية في r (مع أمثلة)
غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل.
طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات المنهجية ، والتي يتم تنفيذها في عملية بسيطة من خطوتين:
1. ضع كل فرد من السكان في ترتيب معين.
2. اختر نقطة بداية عشوائية وحدد عضوًا واحدًا من أصل n ليكون جزءًا من العينة.
يشرح هذا البرنامج التعليمي كيفية إجراء أخذ العينات المنهجية في R.
مثال: أخذ العينات المنهجية في R
لنفترض أن مدير المدرسة يريد الحصول على عينة مكونة من 100 طالب من مدرسة تضم إجمالي 500 طالب. اختارت استخدام أخذ العينات المنهجي الذي تضع فيه كل طالب بالترتيب الأبجدي بناءً على اسمه الأخير، وتختار عشوائيًا نقطة البداية، وتختار كل طالب خامس ليكون في العينة.
يوضح الكود التالي كيفية إنشاء إطار بيانات مزيف للعمل معه في R:
#make this example reproducible set.seed(1) #create simple function to generate random last names randomNames <- function (n = 5000) { do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE)) } #create data frame df <- data.frame(last_name = randomNames(500), gpa = rnorm(500, mean=82, sd=3)) #view first six rows of data frame head(df) last_name gpa 1 GONBW 82.19580 2 JRRWZ 85.10598 3 ORJFW 88.78065 4 XRYNL 85.94409 5 FMDCE 79.38993 6 XZBJC 80.49061
والكود التالي يوضح كيفية الحصول على عينة مكونة من 100 طالب من خلال أخذ العينات المنهجية:
#define function to obtain systematic sample obtain_sys = function (N,n){ k = ceiling(N/n) r = sample(1:k, 1) seq(r, r + k*(n-1), k) } #obtain systematic sample sys_sample_df = df[obtain_sys( nrow (df), 100), ] #view first six rows of data frame head(sys_sample_df) last_name gpa 3 ORJFW 88.78065 8 RWPSB 81.96988 13 RACZU 79.21433 18 ZOHKA 80.47246 23 QJETK 87.09991 28 JTHWB 83.87300 #view dimensions of data frame dim(sys_sample_df) [1] 100 2
لاحظ أن العضو الأول المدرج في العينة كان في الصف 3 من إطار البيانات الأصلي. يقع كل عضو تالي في العينة على بعد 5 أسطر من العضو السابق.
وباستخدام dim() ، يمكننا أن نرى أن العينة المنهجية التي حصلنا عليها عبارة عن إطار بيانات مكون من 100 صف وعمودين.
مصادر إضافية
أنواع طرق أخذ العينات
أخذ العينات الطبقية في R
أخذ العينات العنقودية في R