قيمة p مقابل. ألفا: ما هو الفرق؟


المصطلحان اللذان غالبًا ما يخلطهما الطلاب في الإحصاء هما القيمة الاحتمالية (p-value) والقيمة ألفا (alpha) .

يتم استخدام كلا المصطلحين فياختبار الفرضيات ، وهي اختبارات إحصائية رسمية نستخدمها لرفض الفرضية أو الفشل في رفضها.

على سبيل المثال، لنفترض أننا نفترض أن حبوب منع الحمل الجديدة تقلل من ضغط دم المرضى بشكل أكبر من حبوب منع الحمل القياسية الحالية.

ولاختبار ذلك، يمكننا إجراء اختبار الفرضيات الذي نحدد فيه الفرضيات الصفرية والبديلة التالية:

الفرضية الصفرية: لا يوجد فرق بين الحبة الجديدة والحبة القياسية.

الفرضية البديلة: هناك فرق بين الحبة الجديدة والحبة القياسية.

إذا افترضنا أن الفرضية الصفرية صحيحة، فإن القيمة p للاختبار تخبرنا باحتمالية الحصول على تأثير كبير على الأقل مثل ذلك الذي لاحظناه بالفعل في بيانات العينة.

على سبيل المثال، لنفترض أننا وجدنا أن القيمة p لاختبار الفرضية هي 0.02.

وإليك كيفية تفسير هذه القيمة الاحتمالية: إذا لم يكن هناك فرق حقيقي بين الحبة الجديدة والحبة القياسية، فعندئذ في 2% من المرات التي نجري فيها اختبار الفرضية هذا، سنحصل على التأثير الملحوظ في عينة البيانات، أو أكثر، ببساطة بسبب خطأ في أخذ العينات العشوائية.

وهذا يخبرنا أن الحصول على عينات البيانات التي حصلنا عليها بالفعل سيكون أمرًا نادرًا إلى حد ما إذا لم يكن هناك فرق بين الحبة الجديدة والحبة القياسية.

وبالتالي، فإننا نميل إلى رفض فرضية العدم ونستنتج أن هناك فرقًا بين الحبة الجديدة والحبة القياسية.

ولكن ما هي العتبة التي يجب أن نستخدمها لتحديد ما إذا كانت القيمة الاحتمالية لدينا منخفضة بما يكفي لرفض فرضية العدم؟

هذا هو المكان الذي يأتي فيه ألفا!

مستوى ألفا

مستوى ألفا لاختبار الفرضية هو العتبة التي نستخدمها لتحديد ما إذا كانت القيمة p لدينا منخفضة بما يكفي لرفض الفرضية الصفرية. يتم ضبطه غالبًا على 0.05، ولكن يتم ضبطه أحيانًا على 0.01 أو 0.10.

على سبيل المثال، إذا قمنا بتعيين مستوى ألفا لاختبار الفرضية على 0.05 وحصلنا على قيمة p تبلغ 0.02، فسنرفض فرضية العدم نظرًا لأن القيمة p أقل من مستوى ألفا. وبذلك نستنتج أن لدينا أدلة كافية للقول بصحة الفرضية البديلة.

من المهم ملاحظة أن مستوى ألفا يحدد أيضًا احتمالية الرفض الخاطئ لفرضية العدم الحقيقية.

على سبيل المثال، لنفترض أننا نريد اختبار ما إذا كان هناك فرق في متوسط انخفاض ضغط الدم بين الحبة الجديدة والحبة الحالية أم لا. ولنفترض أنه لا يوجد فرق بين الحبتين.

إذا قمنا بتعيين مستوى ألفا لاختبار الفرضية عند 0.05، فهذا يعني أننا إذا كررنا عملية اختبار الفرضية عدة مرات، فإننا نتوقع رفض الفرضية الصفرية بشكل خاطئ في حوالي 5٪ من الحالات. الاختبارات.

كيفية اختيار مستوى ألفا

كما ذكرنا سابقًا، فإن الاختيار الأكثر شيوعًا لمستوى ألفا لاختبار الفرضية هو 0.05. ومع ذلك، في بعض المواقف التي تؤدي فيها الاستنتاجات الخاطئة إلى عواقب وخيمة، يمكننا ضبط مستوى ألفا أقل، ربما 0.01.

على سبيل المثال، في المجال الطبي، من الشائع للباحثين تحديد مستوى ألفا عند 0.01 لأنهم يريدون التأكد من موثوقية نتائج اختبار الفرضيات.

على العكس من ذلك، في مجالات مثل التسويق، قد يكون من الأكثر شيوعًا تعيين مستوى ألفا أعلى، مثل 0.10، لأن عواقب ارتكاب الخطأ ليست الحياة ولا الموت.

تجدر الإشارة إلى أن زيادة مستوى ألفا للاختبار سيزيد من فرص العثور على نتيجة اختبار الأهمية، ولكنه سيزيد أيضًا من فرص رفض فرضية العدم الحقيقية بشكل خاطئ.

ملخص:

إليك ما تعلمناه في هذا المقال:

1. تخبرنا القيمة p باحتمالية الحصول على تأثير لا يقل حجمه عن التأثير الذي لاحظناه بالفعل في بيانات العينة.

2. مستوى ألفا هو احتمال الرفض الخاطئ لفرضية العدم الحقيقية.

3. إذا كانت القيمة p لاختبار الفرضية أقل من مستوى ألفا، فيمكننا رفض الفرضية الصفرية.

4. تؤدي زيادة مستوى ألفا للاختبار إلى زيادة فرصة العثور على نتيجة اختبار مهمة، ولكنها تزيد أيضًا من فرصة رفض فرضية العدم الحقيقية بشكل خاطئ.

مصادر إضافية

مقدمة لاختبار الفرضيات
كيفية كتابة فرضية العدم (5 أمثلة)
كيفية التعرف على اليسار مقابل اليسار الاختبار الصحيح

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *