كيف تؤثر القيم المتطرفة على المتوسط؟
في الإحصاء، متوسط مجموعة من البيانات هو متوسط القيمة. من المفيد معرفة ذلك لأنه يعطينا فكرة عن مكان “مركز” مجموعة البيانات. يتم حسابه باستخدام الصيغة البسيطة:
المتوسط = (مجموع الملاحظات) / (عدد الملاحظات)
على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية:
[1، 4، 5، 6، 7]
متوسط مجموعة البيانات هو (1+4+5+6+7) / (5) = 4.6
ولكن على الرغم من أن المتوسط مفيد وسهل الحساب، إلا أن له عيبًا: يمكن أن يتأثر بالقيم المتطرفة . على وجه الخصوص، كلما كانت مجموعة البيانات أصغر، كلما زاد تأثير القيم المتطرفة على المتوسط.
لتوضيح ذلك، خذ بعين الاعتبار المثال الكلاسيكي التالي:
عشرة رجال يجلسون في الحانة. متوسط دخل عشرة رجال هو 50 ألف دولار. وفجأة يخرج رجل ويدخل بيل جيتس. اليوم، يبلغ متوسط دخل الرجال العشرة في الحانة 40 مليون دولار.
يوضح هذا المثال كيف يمكن لشخص غريب (بيل جيتس) أن يؤثر بشكل كبير على المتوسط.
القيم المتطرفة الصغيرة والكبيرة
يمكن أن تؤثر القيم المتطرفة على المتوسط من خلال كونها صغيرة بشكل غير عادي أو كبيرة بشكل غير عادي. في المثال السابق، كان لدى بيل جيتس دخل مرتفع بشكل غير عادي، مما يجعل المتوسط مضللاً.
ومع ذلك، فإن القيمة المنخفضة بشكل غير عادي يمكن أن تؤثر أيضًا على المتوسط. ولتوضيح ذلك خذ المثال التالي:
يتقدم عشرة طلاب للامتحان ويحصلون على الدرجات التالية:
[0، 88، 90، 92، 94، 95، 95، 96، 97، 99]
متوسط الدرجات هو 84.6 .
ومع ذلك، إذا قمنا بإزالة النتيجة “0” من مجموعة البيانات، يصبح متوسط النتيجة 94 .
تؤدي الدرجة المنخفضة بشكل غير عادي للطالب إلى خفض متوسط مجموعة البيانات بأكملها.
حجم العينة والقيم المتطرفة
كلما كان حجم عينة مجموعة البيانات أصغر، زاد احتمال تأثير القيم المتطرفة على المتوسط.
على سبيل المثال، لنفترض أن لدينا مجموعة بيانات مكونة من 100 درجة اختبار سجل فيها جميع الطلاب 90 درجة على الأقل أو أعلى، باستثناء طالب واحد حصل على صفر:
[ 0 ، 90، 90، 92، 94، 95، 95، 96، 97، 99، 94، 90، 90، 92، 94، 95، 95، 96، 97، 99، 93، 90، 90، 92، 94 , 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99 , 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92, 94 , 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99 ]
المتوسط هو 93.18 . إذا أزلنا “0” من مجموعة البيانات، فسيكون المتوسط 94.12 . وهذا فرق صغير نسبيا. وهذا يوضح أنه حتى القيم المتطرفة المتطرفة لها تأثير ضئيل فقط إذا كانت مجموعة البيانات كبيرة بما يكفي.
كيفية التعامل مع القيم المتطرفة
إذا كنت قلقًا بشأن احتمال وجود قيمة متطرفة في مجموعة البيانات الخاصة بك، فلديك عدة خيارات:
- تأكد من أن القيمة المتطرفة ليست نتيجة لخطأ في إدخال البيانات. في بعض الأحيان يقوم الفرد ببساطة بإدخال قيمة بيانات خاطئة أثناء حفظ البيانات. في حالة وجود قيمة خارجية، تحقق أولاً من إدخال القيمة بشكل صحيح وأنها ليست خطأ.
- قم بتعيين قيمة جديدة للقيمة المتطرفة . إذا تبين أن القيمة المتطرفة هي نتيجة لخطأ في إدخال البيانات، فيمكنك أن تقرر تعيين قيمة جديدة لها مثل المتوسط أو الوسيط لمجموعة البيانات.
- إزالة الخارجة. إذا كانت القيمة قيمة متطرفة حقًا، فيمكنك اختيار إزالتها إذا كان لها تأثير كبير على تحليلك الإجمالي. فقط تأكد من الإشارة في تقريرك أو تحليلك النهائي إلى أنك قمت بإزالة القيم المتطرفة.
استخدم الوسيط
هناك طريقة أخرى للعثور على “مركز” مجموعة البيانات وهي استخدام الوسيط ، الذي يتم الحصول عليه عن طريق ترتيب جميع القيم الفردية في مجموعة البيانات من الأصغر إلى الأكبر وإيجاد القيمة المتوسطة.
نظرًا لطريقة حسابه، يكون الوسيط أقل تأثرًا بالقيم المتطرفة ويلتقط بشكل أفضل الموقع المركزي للتوزيع عندما تكون هناك قيم متطرفة.
على سبيل المثال، ضع في اعتبارك الرسم البياني التالي الذي يوضح المساحة المربعة للمنازل في حي معين:
ويتأثر المتوسط بشدة بعدد قليل من المنازل الكبيرة للغاية، في حين أن المتوسط لا يتأثر. وبالتالي، يقوم الوسيط بعمل أفضل في التقاط اللقطات المربعة “النموذجية” للمنزل في ذلك الحي من المتوسط.
قراءة متعمقة:
مقاييس الاتجاه المركزي – المتوسط والوسيط والمنوال
اختبار ديكسون Q للكشف عن القيم المتطرفة
حاسبة المتطرفة