شرح مبسط لكيفية تفسير التباين


في الإحصائيات، غالبًا ما نريد أن نفهم كيفية انتشار القيم في مجموعة البيانات. لقياس ذلك، غالبًا ما نستخدم مقاييس التشتت التالية:

  • النطاق: الفرق بين أكبر وأصغر القيم في مجموعة البيانات.
  • النطاق الربيعي: الفرق بين الربع الأول والربيع الثالث لمجموعة بيانات (الأرباع هي ببساطة قيم تقسم مجموعة البيانات إلى أربعة أجزاء متساوية).
  • الانحراف المعياري: طريقة لقياس المسافة النموذجية بين القيم والمتوسط.
  • التباين: مربع الانحراف المعياري.

من بين هذه المقاييس الأربعة، يميل التباين إلى أن يكون الأكثر صعوبة في الفهم بشكل حدسي. تهدف هذه المقالة إلى تقديم شرح بسيط للتباين.

فهم الانحراف المعياري

قبل أن نتمكن من فهم التباين، يجب علينا أولاً أن نفهم الانحراف المعياري ، والذي يُشار إليه عادة بـ σ .

صيغة حساب الانحراف المعياري هي:

σ = √(Σ (x i – μ) 2 / N)

حيث μ هو متوسط عدد السكان، وx i هو العنصر الأول من السكان، وN هو حجم السكان، وΣ مجرد رمز خيالي يعني “المجموع”.

من الناحية العملية، نادرًا ما تحتاج إلى حساب الانحراف المعياري يدويًا؛ بدلا من ذلك، يمكنك استخدام البرامج الإحصائية أو الآلة الحاسبة.

في أبسط مستوياته، يخبرنا الانحراف المعياري بتوزيع قيم البيانات في مجموعة البيانات. لتوضيح ذلك، خذ بعين الاعتبار مجموعات البيانات الثلاث التالية مع الانحرافات المعيارية المقابلة لها:

[5، 5، 5] الانحراف المعياري = 0 (لا يوجد انتشار على الإطلاق)

[3، 5، 7] الانحراف المعياري = 1.63 (بعض الانحرافات)

[1، 5، 99] الانحراف المعياري = 45.28 (الكثير من السبريد)

يمكن فهم مصطلح “الانحراف المعياري” من خلال النظر إلى الكلمتين المكونتين له:

  • “الانحراف” – يشير هذا إلى المسافة من المتوسط.
  • “قياسي” – يشير هذا إلى المسافة “القياسية” أو “النموذجية” بين القيمة والمتوسط.

بمجرد فهم الانحراف المعياري، يصبح من الأسهل بكثير فهم التباين.

فهم الفجوة

التباين، الذي يُشار إليه عادة بـ σ2 ، هو ببساطة مربع الانحراف المعياري. صيغة العثور على التباين في مجموعة البيانات هي:

σ 2 = Σ (x i – μ) 2 / N

حيث μ هو متوسط عدد السكان، وx i هو العنصر الأول من السكان، وN هو حجم السكان، وΣ مجرد رمز خيالي يعني “المجموع”.

لذا، إذا كان الانحراف المعياري لمجموعة بيانات هو 8، فسيكون الاختلاف 8 2 = 64.

أو، إذا كان الانحراف المعياري لمجموعة بيانات هو 10، فسيكون الاختلاف 10 2 = 100.

أو، إذا كان الانحراف المعياري لمجموعة بيانات هو 3.7، فسيكون الاختلاف 3.7 2 = 13.69.

كلما كانت القيم متناثرة في مجموعة البيانات، كلما زاد التباين. لتوضيح ذلك، خذ بعين الاعتبار مجموعات البيانات الثلاث التالية مع الفروق المقابلة لها:

[5، 5، 5] التباين = 0 (لا يوجد انتشار على الإطلاق)

[3، 5، 7] التباين = 2.67 (بعض الانحرافات)

[1، 5، 99] التباين = 2,050.67 (سبريد كبير)

متى يمكنك استخدام التباين بدلا من الانحراف المعياري؟

بعد قراءة التفسيرات المذكورة أعلاه للانحراف المعياري والتباين، قد تتساءل متى ستستخدم التباين بدلاً من الانحراف المعياري لوصف مجموعة البيانات.

بعد كل شيء، يخبرنا الانحراف المعياري بمتوسط المسافة بين القيمة والمتوسط، بينما يخبرنا التباين بمربع تلك القيمة. يبدو أن الانحراف المعياري أسهل بكثير في الفهم والتفسير.

في الواقع، ستستخدم دائمًا الانحراف المعياري لوصف توزيع القيم في مجموعة البيانات.

ومع ذلك، يمكن أن يكون التباين مفيدًا عند استخدام تقنية مثل ANOVA أو الانحدار ومحاولة شرح التباين الإجمالي للنموذج بسبب عوامل محددة.

على سبيل المثال، قد ترغب في فهم مقدار التباين في درجات الاختبار الذي يمكن تفسيره بواسطة معدل الذكاء ومقدار التباين الذي يمكن تفسيره من خلال ساعات الدراسة.

إذا كان 36% من الاختلاف يرجع إلى معدل الذكاء و64% إلى ساعات الدراسة، فمن السهل أن نفهم ذلك. لكن إذا استخدمنا الانحرافات المعيارية 6 و8، فسيكون الأمر أقل بديهية ولا معنى له في سياق المشكلة.

هناك حالة أخرى قد يكون من الأفضل فيها استخدام التباين بدلاً من الانحراف المعياري وهي عندما تقوم بعمل إحصائي نظري.

في هذه الحالة، يكون من الأسهل استخدام التباين عند الحساب نظرًا لأنك لا تحتاج إلى استخدام علامة الجذر التربيعي.

مصادر إضافية

توفر البرامج التعليمية التالية معلومات إضافية حول التباين:

تباين العينة وتباين السكان: ما الفرق؟
كيفية حساب العينة والتباين السكاني في إكسيل

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *