أخذ العينات المنهجية في الباندا (مع أمثلة)
غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل.
طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات المنهجية ، والتي يتم تنفيذها في عملية بسيطة من خطوتين:
1. ضع كل فرد من السكان في ترتيب معين.
2. اختر نقطة بداية عشوائية وحدد عضوًا واحدًا من أصل n ليكون جزءًا من العينة.
يشرح هذا البرنامج التعليمي كيفية إجراء أخذ العينات المنهجية على DataFrame الباندا في بايثون.
مثال: أخذ العينات المنهجية بين حيوانات الباندا
لنفترض أن أحد المعلمين يريد الحصول على عينة مكونة من 100 طالب من مدرسة تضم إجمالي 500 طالب. اختارت استخدام أخذ العينات المنهجي الذي تضع فيه كل طالب بالترتيب الأبجدي بناءً على اسمه الأخير، وتختار عشوائيًا نقطة البداية، وتختار كل طالب خامس ليكون في العينة.
يوضح التعليمة البرمجية التالية كيفية إنشاء إطار بيانات مزيف للعمل معه في بايثون:
import pandas as pd import numpy as np import string import random #make this example reproducible n.p. random . seeds (0) #create simple function to generate random last names def randomNames(size=6, chars=string. ascii_uppercase ): return ''. join (random. choice (chars) for _ in range(size)) #createDataFrame df = pd.DataFrame({'last_name': [randomNames() for _ in range(500)], 'GPA': np. random . normal (loc=85, scale=3, size=500)}) #view first six rows of DataFrame df. head () last_name GPA 0 PXGPIV 86.667888 1 JKRRQI 87.677422 2 TRIZTC 83.733056 3 YHUGIN 85.314142 4 ZVUNVK 85.684160
والكود التالي يوضح كيفية الحصول على عينة مكونة من 100 طالب من خلال أخذ العينات المنهجية:
#obtain systematic sample by selecting every 5th row sys_sample_df = df. iloc [::5] #view first six rows of DataFrame sys_sample_df. head () last_name gpa 3 ORJFW 88.78065 8 RWPSB 81.96988 13 RACZU 79.21433 18 ZOHKA 80.47246 23 QJETK 87.09991 28 JTHWB 83.87300 #view dimensions of data frame sys_sample_df. shape (100, 2)
لاحظ أن العضو الأول المدرج في العينة كان في الصف الأول من إطار البيانات الأصلي. يقع كل عضو تالي في العينة على بعد 5 أسطر من العضو السابق.
وباستخدام الشكل () يمكننا أن نرى أن العينة النظامية التي حصلنا عليها عبارة عن إطار بيانات مكون من 100 صف وعمودين.
مصادر إضافية
أنواع طرق أخذ العينات
أخذ العينات العنقودية في الباندا
أخذ العينات الطبقية في الباندا