ما هي موثوقية الاختبار وإعادة الاختبار؟ (التعريف & #038؛ مثال)
غالبًا ما يرغب الباحثون في استخدام نوع من الاختبارات لقياس مفهوم مثل الذكاء والكفاءة والقدرة التعليمية وما إلى ذلك. في أفراد مجموعة معينة من السكان.
عند إجراء أي نوع من الاختبارات، من المهم أن يكون الاختبار موثوقًا به . وبعبارة أخرى، من المهم أن يمكن إعادة إنتاج نتائج الاختبار في ظل نفس الظروف وفي وقتين مختلفين.
موثوقية الاختبار وإعادة الاختبار هي طريقة محددة لقياس موثوقية الاختبار وتشير إلى مدى إنتاج الاختبار لنتائج مماثلة مع مرور الوقت.
نقوم بحساب موثوقية الاختبار وإعادة الاختبار باستخدام معامل ارتباط بيرسون ، والذي يأخذ قيمة تتراوح بين -1 و1 حيث:
- -1 يشير إلى وجود علاقة خطية سلبية تمامًا بين درجتين
- يشير 0 إلى عدم وجود علاقة خطية بين درجتين
- يشير الشكل 1 إلى وجود علاقة خطية إيجابية تمامًا بين درجتين
على سبيل المثال، قد نجري اختبار الذكاء لـ 50 مشاركًا في الأول من يناير، ثم نجري نفس النوع من اختبار الذكاء بنفس الصعوبة لنفس المجموعة المكونة من 50 مشاركًا بعد شهر.
يمكننا حساب الارتباط بين الدرجات بين الاختبارين لتحديد ما إذا كان الاختبار يتمتع بموثوقية جيدة للاختبار وإعادة الاختبار.
بشكل عام، يشير ارتباط موثوقية الاختبار وإعادة الاختبار الذي لا يقل عن 0.80 أو أعلى إلى موثوقية جيدة.
مثال: حساب موثوقية الاختبار وإعادة الاختبار
لنفترض أن الباحثين أجروا اختبارًا لعشرين شخصًا، ثم أجروا نفس النوع من الاختبار بعد شهر لنفس العشرين شخصًا.
وتظهر نتائجهم أدناه:
يمكننا استخدام حاسبة الارتباط لنجد أن معامل ارتباط بيرسون بين مجموعتي الدرجات هو 0.836 .
وبما أن هذا الارتباط أكبر من 0.80، يمكن للباحثين أن يستنتجوا أن الاختبار يتمتع بموثوقية اختبار وإعادة اختبار جيدة.
بمعنى آخر، يُنتج الاختبار نتائج موثوقة يمكن إعادة إنتاجها في أوقات مختلفة.
التحيز المحتمل في موثوقية الاختبار وإعادة الاختبار
تعد موثوقية الاختبار وإعادة الاختبار مقياسًا مفيدًا للحساب، ولكن كن على دراية بالتحيزات المحتملة التالية التي قد تؤثر على هذا المقياس:
1. التأثير العملي
يحدث تأثير الممارسة عندما يقوم المشاركون ببساطة بتحسين الاختبار من خلال الممارسة. وهذا يعني أنه من المرجح أن يؤديوا أداءً أفضل في الاختبارات اللاحقة لأنه كان لديهم الوقت للتدرب والتحسين.
الطريقة لتجنب هذا النوع من التحيز هي إعطاء الأفراد اختبارات متساوية الصعوبة ولكن مع مجموعة مختلفة من الأسئلة، بحيث لا يتمكنون من حفظ الإجابات على أنواع الأسئلة المطروحة في الاختبار الأول.
2. تأثير التعب
ويحدث تأثير التعب عندما تتفاقم حالة المشاركين في اختبارات معينة لأنهم مرهقون عقليا أو متعبون بعد إجراء اختبارات سابقة.
تتمثل طريقة تجنب هذا النوع من التحيز في إتاحة وقت كافٍ بين الاختبارات (من الناحية المثالية أسابيع أو حتى أشهر) حتى يكون المشاركون منتعشين عند إجراء كلا الاختبارين.
3. الاختلافات في الظروف
عندما يقوم المشاركون بإجراء الاختبارين في ظل ظروف مختلفة (أي إضاءة مختلفة، ووقت مختلف من اليوم، ووقت مختلف لإكمال الاختبار، وما إلى ذلك)، فمن الممكن أن يحصلوا على نتائج اختبار مختلفة أقل ببساطة بسبب الاختلافات في بيئة الاختبار.
إن طريقة تجنب هذا النوع من التحيز هي التأكد من أن المشاركين يؤدون كلا الاختبارين في ظروف متطابقة، أي في نفس الوقت من اليوم، وبنفس الإضاءة العامة ونفس البيئة، وأن يكون لديهم نفس الوقت لإكمال الاختبار.
مصادر إضافية
مقدمة سريعة لتحليل الموثوقية
ما هو تقسيم الموثوقية إلى النصف؟
ما هي الموثوقية بين المقيمين؟
ما هي موثوقية النماذج المتوازية؟
ما هو الخطأ القياسي في القياس؟