حالة العينة الكبيرة: تعريف ومثال
في الإحصاء، غالبًا ما نرغب في استخدام العينات لاستخلاص استنتاجات حول السكان من خلال اختبار الفرضيات أو فترات الثقة .
تفترض معظم الصيغ التي نستخدمها في اختبار الفرضيات وفترات الثقة أن عينة معينة تتبع التوزيع الطبيعي تقريبًا.
ومع ذلك، من أجل صياغة هذه الفرضية بأمان، نحتاج إلى التأكد من أن حجم العينة لدينا كبير بما فيه الكفاية. وعلى وجه التحديد، نحتاج إلى التأكد من استيفاء شرط العينة الكبيرة .
شرط العينة الكبيرة: أن لا يقل حجم العينة عن 30.
ملحوظة: في بعض الكتب المدرسية، يتم تعريف حجم العينة “الكبير بما فيه الكفاية” على أنه 40 على الأقل، ولكن الرقم 30 هو الأكثر استخدامًا.
وعند استيفاء هذا الشرط يمكن الافتراض أن توزيع المعاينة لمتوسط العينة طبيعي تقريباً. يتيح لنا هذا الافتراض استخدام العينات لاستخلاص استنتاجات حول المجموعات السكانية التي تم استخلاصها منها.
سبب استخدام الرقم 30 يعتمد على نظرية الحد المركزي. يمكنك قراءة المزيد عنها في منشور المدونة هذا.
مثال: التحقق من حالة عينة كبيرة
لنفترض أن آلة معينة تصنع المفرقعات. ينحرف توزيع وزن ملفات تعريف الارتباط هذه إلى اليمين بمتوسط 10 أونصات وانحراف معياري قدره 2 أونصة. إذا أخذنا عينة عشوائية بسيطة مكونة من 100 ملف تعريف ارتباط تم إنتاجها بواسطة هذا الجهاز، فما احتمال أن يكون متوسط وزن ملفات تعريف الارتباط في هذه العينة أقل من 9.8 أوقية؟
للإجابة على هذا السؤال يمكننا استخدام حاسبة CDF العادية ، لكن علينا أولاً التحقق من أن حجم العينة كبير بما يكفي لنفترض أن توزيع متوسط المعاينة طبيعي.
في هذا المثال، حجم العينة لدينا هو n = 100 ، وهو أكبر بكثير من 30. على الرغم من حقيقة أن التوزيع الحقيقي لوزن ملف تعريف الارتباط منحرف إلى اليمين، نظرًا لأن حجم العينة لدينا “كبير بما يكفي”، يمكننا أن نفترض أن التوزيع من متوسط أخذ العينات أمر طبيعي. لذلك يمكننا استخدام حاسبة CDF العادية بأمان لحل هذه المشكلة.
التغييرات في حالة العينات الكبيرة
في كثير من الأحيان، يعتبر حجم العينة “كبيرًا بما يكفي” إذا كان أكبر من أو يساوي 30، ولكن هذا العدد قد يختلف قليلاً اعتمادًا على الشكل الأساسي لتوزيع السكان.
خصوصاً:
- إذا كان توزيع السكان متماثلا، فإن حجم عينة صغير يصل إلى 15 يكون كافيا في بعض الأحيان.
- إذا كان توزيع السكان منحرفا، فمن الضروري عادة عينة لا تقل عن 30 شخصا.
- إذا كان توزيع السكان منحرفا للغاية، فقد يكون من الضروري أخذ عينة من 40 شخصا أو أكثر.
اعتمادًا على شكل توزيع السكان، قد تحتاج إلى حجم عينة أكبر أو أقل من 30 لتطبيق نظرية الحد المركزي.