اختبار ديكسون q: التعريف + المثال
اختبار ديكسون كيو ، والذي يُطلق عليه غالبًا اختبار كيو ببساطة، هو اختبار إحصائي يستخدم للكشف عن القيم المتطرفة في مجموعة البيانات.
إحصائيات اختبار Q هي:
س = |x أ – xb | / ر
حيث x a هي القيمة المتطرفة المشتبه بها، و x b هي أقرب نقطة بيانات إلى x a ، و R هو نطاق مجموعة البيانات. في معظم الحالات، x a هي القيمة القصوى لمجموعة البيانات، ولكنها يمكن أن تكون أيضًا القيمة الدنيا.
من المهم ملاحظة أن اختبار Q يتم إجراؤه عادةً على مجموعات بيانات صغيرة ويفترض أن البيانات يتم توزيعها بشكل طبيعي. ومن المهم أيضًا ملاحظة أنه يجب إجراء اختبار Q مرة واحدة فقط لمجموعة بيانات معينة.
كيفية إجراء اختبار ديكسون كيو يدويًا
لنفترض أن لدينا مجموعة البيانات التالية:
1، 3، 5، 7، 8، 9، 13، 25
يمكننا اتباع إجراء اختبار الفرضيات القياسي المكون من خمس خطوات لإجراء اختبار Dixon’s Q يدويًا لتحديد ما إذا كانت القيمة القصوى في مجموعة البيانات هذه قيمة متطرفة:
الخطوة 1. اذكر الفرضيات.
الفرضية الصفرية (H0): الحد الأقصى ليس قيمة متطرفة.
الفرضية البديلة : (ها) : الحد الأقصى هو قيمة متطرفة .
الخطوة 2. تحديد مستوى الأهمية لاستخدامه.
الاختيارات الشائعة هي 0.1 و0.05 و0.01. سوف نستخدم مستوى أهمية 0.05 لهذا المثال.
الخطوة 3. ابحث عن إحصائية الاختبار.
س = |x أ – xb | / ر
في هذه الحالة، القيمة القصوى لدينا هي x a = 25، والقيمة الأقرب التالية هي x b = 13، ونطاقنا هو R = 25 – 1 = 24.
وبالتالي، س = |25 – 13| / 24 = 0.5 .
ثم يمكننا مقارنة إحصائية الاختبار هذه بقيم اختبار Q الحرجة، والتي تظهر أدناه لأحجام العينات المختلفة (n) ومستويات الثقة:
 ن 90% 95% 99%
 3 0.941 0.970 0.994
 4 0.765 0.829 0.926
 5 0.642 0.710 0.821
 6 0.560 0.625 0.740
 7 0.507 0.568 0.680
 8 0.468 0.526 0.634
 9 0.437 0.493 0.598
 10 0.412 0.466 0.568
 11 0.392 0.444 0.542
 12 0.376 0.426 0.522
 13 0.361 0.410 0.503
 14 0.349 0.396 0.488
 15 0.338 0.384 0.475
 16 0.329 0.374 0.463
 17 0.320 0.365 0.452
 18 0.313 0.356 0.442
 19 0.306 0.349 0.433
 20 0.300 0.342 0.425
 21 0.295 0.337 0.418
 22 0.290 0.331 0.411
 23 0.285 0.326 0.404
 24 0.281 0.321 0.399
 25 0.277 0.317 0.393
 26 0.273 0.312 0.388
 27 0.269 0.308 0.384
 28 0.266 0.305 0.380
 29 0.263 0.301 0.376
 30 0.260 0.290 0.372
القيمة الحرجة لعينة مكونة من 8 ومستوى ثقة 95% هي 0.526 .
الخطوة 4. ارفض أو لا ترفض فرضية العدم.
وبما أن إحصائية الاختبار Q (0.5) أقل من القيمة الحرجة (0.526)، فإننا نفشل في رفض فرضية العدم.
الخطوة 5. تفسير النتائج.
وبما أننا فشلنا في رفض الفرضية الصفرية، فإننا نستنتج أن القيمة القصوى البالغة 25 ليست قيمة متطرفة في مجموعة البيانات هذه.
كيفية إجراء اختبار Dixon’s Q في R
لإجراء اختبار Dixon’s Q على نفس مجموعة البيانات في R، يمكننا استخدام الدالة dixon.test() من مكتبة القيم المتطرفة ، والتي تستخدم بناء الجملة التالي:
dixon.test (البيانات، النوع = 10، العكس = FALSE)
- البيانات: ناقل رقمي لقيم البيانات
- النوع: نوع الصيغة المستخدمة لإجراء اختبار Q الإحصائي. اضبط على 10 لاستخدام الصيغة الموضحة مسبقًا.
- العكس: إذا كان FALSE، يحدد الاختبار ما إذا كانت القيمة القصوى تمثل قيمة متطرفة. إذا كانت القيمة TRUE، فإن الاختبار يحدد ما إذا كانت القيمة الدنيا تمثل قيمة متطرفة. وهذا خطأ بشكل افتراضي.
ملحوظة : ابحث عن الوثائق الكاملة لـ dixon.test() هنا .
يوضح التعليمة البرمجية التالية كيفية إجراء اختبار Dixon’s Q لتحديد ما إذا كانت القيمة القصوى في مجموعة البيانات قيمة خارجية.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
من النتيجة يمكننا أن نرى أن إحصائيات الاختبار هي Q = 0.5 والقيمة p المقابلة هي 0.06913 . وبالتالي، فإننا نفشل في رفض الفرضية الصفرية عند مستوى الأهمية 0.05 ونستنتج أن 25 ليست قيمة متطرفة. وهذا يتوافق مع النتيجة التي حصلنا عليها يدويًا.
