مزايا وعيوب استخدام المتوسط في الإحصاء
يمثل متوسط مجموعة البيانات متوسط قيمة مجموعة البيانات.
يتم حسابه على النحو التالي:
المتوسط = Σx ط / ن
ذهب:
- Σ: رمز يعني “المجموع”
- xi : الملاحظة i في مجموعة بيانات
- n: إجمالي عدد الملاحظات في مجموعة البيانات
هناك ميزتان رئيسيتان لاستخدام المتوسط لوصف “المركز” أو “المتوسط” لمجموعة البيانات:
الميزة رقم 1: يستخدم المتوسط جميع الملاحظات من مجموعة البيانات في حسابه. في الإحصائيات، يعد هذا أمرًا جيدًا بشكل عام لأنه يقال إنه يستخدم جميع المعلومات المتوفرة في مجموعة البيانات.
الميزة رقم 2: المتوسط سهل الحساب والتفسير. المتوسط هو مجموع كل الملاحظات مقسومًا على إجمالي عدد الملاحظات. من السهل حسابه (حتى يدويًا) وسهل تفسيره.
ومع ذلك، فإن استخدام المتوسط لتلخيص مجموعة البيانات له عيبان محتملان:
العيب رقم 1: يتأثر المتوسط بالقيم المتطرفة. إذا كانت مجموعة البيانات تحتوي على قيمة متطرفة، فإن هذا يؤثر على المتوسط ويجعله مقياسًا غير موثوق به لمركز مجموعة البيانات.
العيب رقم 2: يمكن أن يكون المتوسط مضللاً مع مجموعات البيانات المنحرفة. عند إمالة مجموعة بيانات إلى اليسار أو اليمين ، يمكن أن يكون حساب المتوسط طريقة مضللة لقياس مركز مجموعة البيانات.
توضح الأمثلة التالية هذه المزايا والعيوب في الممارسة العملية.
المثال 1: فوائد استخدام المتوسط
لنفترض أن لدينا الرسم البياني التالي الذي يوضح رواتب سكان مدينة معينة:
نظرًا لأن هذا التوزيع متماثل بشكل عام (إذا قمت بتقسيمه إلى المنتصف، فسيبدو كل نصف متساويًا تقريبًا) ولا توجد قيم متطرفة، فإن المتوسط هو وسيلة مفيدة لوصف مركز هذه المجموعة من البيانات.
ويتبين أن المتوسط هو 63000 دولار، وهو تقريبًا في وسط التوزيع:
في هذا المثال تحديدًا، تمكنا من استخدام ميزتي المتوسط:
الميزة رقم 1: يستخدم المتوسط جميع الملاحظات من مجموعة البيانات في حسابه.
نظرًا لأن التوزيع كان متماثلًا بشكل أساسي ولم تكن هناك قيم متطرفة، فقد تمكنا من استخدام جميع الرواتب المتاحة لحساب المتوسط، مما أعطانا فكرة جيدة عن الراتب “المتوسط” أو “النموذجي” في هذه المدينة بالذات.
الميزة رقم 2: المتوسط سهل الحساب والتفسير. من السهل أن نفهم أن متوسط الراتب البالغ 63000 دولار يمثل “متوسط” الراتب للفرد في هذه المدينة.
وعلى الرغم من أن بعض الأفراد يكسبون أكثر من هذا بكثير والبعض الآخر أقل بكثير، إلا أن هذه القيمة المتوسطة تعطينا فكرة جيدة عن الراتب “النموذجي” في هذه المدينة.
المثال 2: عيوب استخدام المتوسط
لنفترض أن لدينا توزيعًا منحرفًا للغاية للرواتب وقررنا حساب كل من متوسط ومتوسط الراتب:
القيم الأعلى في ذيل التوزيع تحرك الوسط بعيدًا عن المركز وباتجاه الذيل الطويل.
في هذا المثال، يخبرنا المتوسط أن الفرد العادي يكسب حوالي 47000 دولار سنويًا، بينما يخبرنا المتوسط أن الفرد العادي يكسب حوالي 32000 دولار سنويًا فقط، وهو ما يمثل أكثر بكثير للفرد النموذجي.
في هذا المثال، يلخص المتوسط بشكل سيئ القيمة “النموذجية” أو “المتوسطة” في هذا التوزيع نظرًا لأن التوزيع منحرف.
أو لنفترض أن لدينا توزيعًا آخر يحتوي على معلومات حول المساحة المربعة للمنازل في شارع معين وقررنا حساب كل من المتوسط والوسيط لمجموعة البيانات:
يتأثر المتوسط بعدد قليل من المنازل الكبيرة للغاية، مما يجعله يأخذ قيمة أعلى بكثير.
وهذا يجعل متوسط قيمة اللقطات المربعة مضللاً ويعطي قياسًا سيئًا للقدم المربع “النموذجي” للمنزل في ذلك الشارع.
مصادر إضافية
توفر البرامج التعليمية التالية معلومات إضافية حول المتوسط والوسيط في الإحصاء:
كيف تؤثر القيم المتطرفة على المتوسط؟
كيفية تقدير المتوسط والوسيط لأي رسم بياني
كيفية العثور على المتوسط والوسيط لمؤامرات الساق والأوراق