أخذ العينات مع الاستبدال أو بدون الاستبدال
في كثير من الأحيان، في الإحصائيات، نرغب في جمع البيانات حتى نتمكن من الإجابة على أسئلة بحثية معينة.
على سبيل المثال، قد نرغب في الإجابة على الأسئلة التالية:
1. ما هو متوسط دخل الأسرة في سينسيناتي، أوهايو؟
2. ما هو متوسط وزن مجموعة معينة من السلاحف؟
3. ما هي نسبة السكان في مقاطعة معينة تدعم قانونًا معينًا؟
في كل سيناريو، نريد الإجابة على سؤال حول عدد السكان ، والذي يمثل جميع العناصر الفردية المحتملة التي نريد قياسها.
ومع ذلك، بدلاً من جمع البيانات عن كل فرد في المجتمع، فإننا عادةً ما نجمع البيانات فقط عن عينة من السكان، والتي تمثل جزءًا من السكان.
هناك طريقتان مختلفتان لجمع العينات: أخذ العينات مع الاستبدال وأخذ العينات بدون استبدال .
يشرح هذا البرنامج التعليمي الفرق بين الطريقتين مع أمثلة حول كيفية استخدام كل منهما عمليًا.
أخذ العينات مع الاستبدال
لنفترض أن لدينا أسماء 5 طلاب في قبعة:
- آندي
- كارل
- تايلر
- بيكا
- جيسيكا
لنفترض أننا نريد أخذ عينة من طالبين مع استبدالهما.
في الرسم الأول، قد نختار اسم تايلر. ثم نعيد اسمه إلى القبعة ونرسم مرة أخرى. في الرسم الثاني، قد نختار اسم تايلر مرة أخرى. إذن نموذجنا سيكون: {Tyler, Tyler}
وهذا مثال للحصول على عينة مع الاستبدال لأننا نستبدل الاسم الذي نختاره بعد كل رسمة.
عندما نأخذ عينة مع الاستبدال، تكون عناصر العينة مستقلة لأن نتيجة رمية عملة واحدة لا تتأثر بالرمية السابقة للعملة.
على سبيل المثال، احتمال اختيار اسم تايلر هو 1/5 في الرسم الأول ومرة أخرى 1/5 في الرسم الثاني. لا تؤثر نتيجة السحب الأول على احتمالية نتيجة السحب الثاني.
يتم استخدام أخذ العينات مع الاستبدال في العديد من السيناريوهات المختلفة في الإحصاء والتعلم الآلي، بما في ذلك:
في كل من هذه الطرق، يتم استخدام أخذ العينات مع الاستبدال لأنه يسمح لنا باستخدام نفس مجموعة البيانات عدة مرات لبناء النماذج، بدلاً من جمع بيانات جديدة، الأمر الذي قد يستغرق وقتًا طويلاً ومكلفًا.
أخذ العينات دون استبدال
مرة أخرى، لنفترض أن لدينا أسماء 5 طلاب في قبعة:
- آندي
- كارل
- تايلر
- بيكا
- جيسيكا
لنفترض أننا نريد أخذ عينة من طالبين دون استبدال.
في الرسم الأول، قد نختار اسم تايلر. ثم نترك اسمه جانبا. في الرسم الثاني يمكننا اختيار اسم آندي. إذن نموذجنا سيكون: {Tyler, Andy}
وهذا مثال على الحصول على عينة بدون استبدال لأننا لا نستبدل الاسم الذي نختاره بعد كل رسمة.
عندما نأخذ العينة دون استبدال، فإن عناصر العينة تكون مستقلة لأن نتيجة رمية عملة واحدة تتأثر بالرمية السابقة للعملة.
على سبيل المثال، احتمال اختيار اسم تايلر هو 1/5 في الرسم الأول واحتمال اختيار اسم آندي هو 1/4 في الرسم الثاني. تؤثر نتيجة السحب الأول على احتمالية نتيجة السحب الثاني.
أخذ العينات بدون استبدال هو الطريقة التي نستخدمها عندما نريد اختيار عينة عشوائية من مجتمع ما.
على سبيل المثال، إذا أردنا تقدير متوسط دخل الأسرة في مدينة سينسيناتي بولاية أوهايو، فمن الممكن أن يكون هناك إجمالي 500000 أسرة مختلفة.
لذلك، قد نرغب في جمع عينة عشوائية مكونة من 2000 أسرة، ولكننا لا نريد أن تظهر بيانات أي أسرة معينة مرتين في العينة، لذلك سنقوم بالعينة دون استبدال.
بمعنى آخر، بمجرد اختيارنا لأسرة معينة لإدراجها في العينة، فإننا لا نريد أن تكون لدينا أي فرصة لاختيار تلك الأسرة لإدراجها مرة أخرى.