مزايا وعيوب استخدام الانحراف المعياري
الانحراف المعياري لمجموعة البيانات هو وسيلة لقياس الانحراف النموذجي للقيم الفردية عن القيمة المتوسطة.
صيغة حساب الانحراف المعياري للعينة، والمشار إليها بـ s ، هي:
ق = √ Σ(س ط – س̄) 2 / (ن – 1)
ذهب:
- Σ : رمز يعني “المجموع”
- x i : القيمة i في مجموعة البيانات
- x̄ : تعني العينة
- ن : حجم العينة
هناك ميزتان رئيسيتان لاستخدام الانحراف المعياري لوصف توزيع القيم في مجموعة البيانات:
الميزة رقم 1: يستخدم الانحراف المعياري جميع الملاحظات في مجموعة البيانات في حسابه. في الإحصاء، نقول بشكل عام إنه أمر جيد أن نكون قادرين على استخدام جميع الملاحظات في مجموعة بيانات لإجراء العمليات الحسابية، لأننا نستخدم جميع “المعلومات” الممكنة المتاحة في مجموعة البيانات.
الميزة رقم 2: الانحراف المعياري سهل التفسير . الانحراف المعياري هو قيمة واحدة تعطينا فكرة جيدة عن مدى بُعد الملاحظة “النموذجية” في مجموعة البيانات عن القيمة المتوسطة.
ومع ذلك، فإن استخدام الانحراف المعياري له عيب كبير:
العيب رقم 1: يمكن أن يتأثر الانحراف المعياري بالقيم المتطرفة . عند وجود قيم متطرفة في مجموعة بيانات، يمكن أن يؤدي ذلك إلى تضخيم قيمة الانحراف المعياري وبالتالي إعطاء فكرة مضللة عن توزيع القيم في مجموعة البيانات.
توفر الأمثلة التالية مزيدًا من المعلومات حول مزايا وعيوب استخدام الانحراف المعياري.
الميزة رقم 1: الانحراف المعياري يستخدم جميع الملاحظات
لنفترض أن لدينا مجموعة البيانات التالية التي توضح توزيع درجات الامتحانات للطلاب في الفصل الدراسي:
التقييمات: 68، 70، 71، 75، 78، 82، 83، 83، 85، 90، 91، 91، 92
يمكننا استخدام الآلة الحاسبة أو البرنامج الإحصائي لنجد أن عينة الانحراف المعياري لمجموعة البيانات هذه هي 8.46.
تتمثل ميزة استخدام الانحراف المعياري في هذا المثال في أننا نستخدم جميع الملاحظات الممكنة في مجموعة البيانات للعثور على “التوزيع” النموذجي للقيم.
في المقابل، يمكننا استخدام مقياس آخر مثل النطاق الربيعي لقياس توزيع القيم في مجموعة البيانات هذه.
يمكننا استخدام الآلة الحاسبة لإيجاد أن المدى الربيعي هو 17.5 . ويمثل هذا الفجوة بين الـ 50% الوسطى من القيم في مجموعة البيانات.
لنفترض الآن أننا قمنا بتغيير القيمة الأدنى في مجموعة البيانات لتكون أقل بكثير:
التقييمات: 22، 70، 71، 75، 78، 82، 83، 83، 85، 90، 91، 91، 92
يمكننا استخدام الآلة الحاسبة لنجد أن الانحراف المعياري للعينة هو 18.37 .
ومع ذلك، فإن المدى الربيعي لا يزال 17.5 لأنه لم يتأثر أي من الـ 50% الوسطى من القيم.
يوضح هذا أن الانحراف المعياري للعينة يأخذ في الاعتبار جميع الملاحظات في مجموعة البيانات في حسابه، على عكس مقاييس التشتت الأخرى.
الميزة رقم 2: الانحراف المعياري سهل التفسير
تذكر مجموعة البيانات التالية التي توضح توزيع درجات الامتحانات للطلاب في الفصل الدراسي:
التقييمات: 68، 70، 71، 75، 78، 82، 83، 83، 85، 90، 91، 91، 92
استخدمنا الآلة الحاسبة لنجد أن نموذج الانحراف المعياري لمجموعة البيانات هذه كان 8.46 .
من السهل تفسير ذلك لأنه يعني ببساطة أن انحراف درجة الاختبار “النموذجي” يبلغ حوالي 8.46 عن متوسط درجة الاختبار.
ومن ناحية أخرى، فإن مقاييس التشتت الأخرى ليست سهلة التفسير.
على سبيل المثال، معامل الاختلاف هو مقياس آخر للتشتت يمثل نسبة الانحراف المعياري إلى متوسط العينة.
معامل الاختلاف: s/x̄
في هذا المثال متوسط درجات الامتحان هو 81.46، لذلك يتم حساب معامل الاختلاف على النحو التالي: 8.46 / 81.46 = 0.104 .
يمثل هذا نسبة الانحراف المعياري للعينة إلى متوسط العينة، والتي يمكن أن تكون مفيدة لمقارنة توزيع القيم عبر مجموعات بيانات متعددة، ولكن ليس من السهل جدًا تفسيرها كمقياس في حد ذاته.
العيب رقم 1: يمكن أن يتأثر الانحراف المعياري بالقيم المتطرفة
لنفترض أن لدينا مجموعة البيانات التالية التي تحتوي على معلومات الرواتب لـ 10 موظفين (بآلاف الدولارات) في الشركة:
الرواتب: 44، 48، 57، 68، 70، 71، 73، 79، 84، 94
ويبلغ الانحراف المعياري للعينة للرواتب حوالي 15.57 .
لنفترض الآن أن لدينا نفس مجموعة البيانات بالضبط، ولكن الراتب الأعلى أعلى بكثير :
الرواتب: 44، 48، 57، 68، 70، 71، 73، 79، 84، 895
يبلغ نموذج الانحراف المعياري للرواتب في مجموعة البيانات هذه حوالي 262.47 .
ومن خلال تضمين قيمة متطرفة واحدة فقط، يتأثر الانحراف المعياري بشكل كبير ويعطي الآن فكرة مضللة عن توزيع الرواتب “النموذجي”.
ملاحظة : عند وجود القيم المتطرفة في مجموعة بيانات، يمكن أن يوفر النطاق الربيعي مقياسًا أفضل للتشتت لأنه لا يتأثر بالقيم المتطرفة.
مصادر إضافية
توفر البرامج التعليمية التالية معلومات إضافية حول استخدام الانحراف المعياري في الإحصائيات:
المدى الربيعي والانحراف المعياري: الفرق
معامل الاختلاف مقابل الانحراف المعياري: الفرق
السكان مقابل نموذج الانحراف المعياري: متى يتم استخدام كل منهما