الحد الأدنى لحجم العينة لاختبار t: الشرح والمثال
السؤال الشائع الذي يطرحه الطلاب هو:
هل هناك حد أدنى لحجم العينة مطلوب لإجراء اختبار t؟
الجواب القصير:
لا، لا يوجد حد أدنى لحجم العينة المطلوب لإجراء اختبار t.
في الواقع، أول اختبار t تم استخدامه على الإطلاق استخدم عينة مكونة من أربعة أشخاص فقط.
ومع ذلك، إذا لم يتم استيفاء افتراضات اختبار t، فقد لا تكون النتائج موثوقة.
بالإضافة إلى ذلك، إذا كان حجم العينة صغيرًا جدًا، فقد تكون قوة الاختبار منخفضة جدًا بحيث لا تتمكن من اكتشاف اختلافات كبيرة في البيانات.
دعونا نلقي نظرة على كل من هذه المشكلات المحتملة بمزيد من التفصيل.
فهم افتراضات اختبار t
يتم استخدام اختبار t لعينة واحدة لاختبار ما إذا كان متوسط المجتمع يساوي قيمة معينة أم لا.
يقوم هذا الاختبار بالافتراضات التالية:
- الاستقلالية : يجب أن تكون ملاحظات العينة مستقلة.
- أخذ العينات العشوائية : ينبغي جمع الملاحظات باستخدام طريقة أخذ العينات العشوائية لتعظيم فرصة أن تكون العينة ممثلة للمجتمع محل الاهتمام.
- الحالة الطبيعية : يجب أن يتم توزيع الملاحظات بشكل طبيعي تقريبًا.
يتم استخدام اختبار t المكون من عينتين للتحقق مما إذا كان هناك فرق كبير بين متوسطي مجتمعين.
يقوم هذا الاختبار بالافتراضات التالية:
- الاستقلالية : يجب أن تكون ملاحظات كل عينة مستقلة.
- أخذ العينات العشوائية : يجب جمع الملاحظات من كل عينة باستخدام طريقة أخذ العينات العشوائية.
- الحالة الطبيعية : ينبغي توزيع كل عينة بشكل طبيعي تقريبًا.
- التباين المتساوي : يجب أن تحتوي كل عينة على نفس التباين تقريبًا.
عند إجراء كل نوع من اختبارات t، إذا لم يتم استيفاء واحد أو أكثر من هذه الافتراضات، فقد تصبح نتائج الاختبار غير موثوقة.
في هذه الحالة، من الأفضل استخدام اختبار غير معلمي بديل لا يقدم هذه الافتراضات.
البديل غير المعلمي لاختبار t لعينة واحدة هو اختبار رتبة موقعة ويلكوكسون .
البديل اللامعلمي لاختبار t المكون من عينتين هو اختبار مان ويتني يو .
فهم قوة اختبارات t
تشير القوة الإحصائية إلى احتمال أن يكتشف الاختبار التأثير عندما يكون موجودًا بالفعل.
ويمكن إثبات أنه كلما كان حجم العينة المستخدمة أصغر، كلما انخفضت القوة الإحصائية لاختبار معين. ولهذا السبب يريد الباحثون عمومًا أحجامًا أكبر للعينات من أجل الحصول على قوة أعلى وبالتالي احتمالية أكبر لاكتشاف الاختلافات الحقيقية.
على سبيل المثال، لنفترض أن حجم التأثير الحقيقي بين مجموعتين سكانيتين هو 0.5 – حجم تأثير “متوسط”. يمكننا استخدام كود R التالي لحساب قوة اختبار t المكون من عينتين باستخدام أحجام عينات مختلفة:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
وإليك كيفية تفسير النتائج:
- عندما يكون حجم كل عينة n = 10، تكون القدرة 0.184 .
- عندما يكون حجم كل عينة n = 30، تكون القدرة 0.478 .
- عندما يكون حجم كل عينة n = 50، تكون القدرة 0.697 .
يمكننا أن نرى أن قوة الاختبار تزداد مع زيادة حجم العينة.
وبالتالي، فإننا لا نحتاج إلى حد أدنى لحجم العينة لإجراء اختبار t، ولكن أحجام العينات الصغيرة تؤدي إلى انخفاض القوة الإحصائية وبالتالي تقليل القدرة على اكتشاف الفرق الحقيقي في البيانات.
خاتمة
وفيما يلي ملخص لما تعلمناه:
- لا يوجد حد أدنى لحجم العينة المطلوبة لإجراء اختبار t.
- إذا لم يتم استيفاء افتراضات اختبار t، فيجب علينا استخدام بديل غير معلمي.
- إذا كان حجم العينة صغيرًا جدًا، فستكون قوة اختبار t منخفضة وستكون قدرة الاختبار على اكتشاف الاختلافات الحقيقية في البيانات منخفضة.
مصادر إضافية
توفر البرامج التعليمية التالية معلومات إضافية حول اختبارات t.
مقدمة لاختبار t للعينة الواحدة
مقدمة لاختبار t ذو العينتين
مقدمة لاختبار t للعينات المقترنة
الفرضيات الأربع التي تمت صياغتها في اختبار t