ما يعتبر "قويا"؛ علاقة؟
في الإحصاء، نسعى غالبًا إلى فهم كيفية ارتباط متغيرين ببعضهما البعض. على سبيل المثال، قد نريد أن نعرف:
- ما العلاقة بين عدد الساعات التي يدرسها الطالب والدرجة التي يحصل عليها في الامتحان؟
- ما العلاقة بين درجة الحرارة الخارجية وعدد أكواز الآيس كريم التي تبيعها شاحنة الطعام؟
- ما هي العلاقة بين الدولارات التسويقية التي يتم إنفاقها وإجمالي الإيرادات المكتسبة لشركة معينة؟
في كل من هذه السيناريوهات، نحاول فهم العلاقة بين متغيرين مختلفين.
في الإحصاء، إحدى الطرق الأكثر شيوعًا لتحديد العلاقة بين متغيرين هي استخدام معامل ارتباط بيرسون ، وهو مقياس للارتباط الخطي بين متغيرين . لها قيمة بين -1 و 1 حيث:
- يشير -1 إلى وجود علاقة خطية سلبية تمامًا بين متغيرين
- يشير 0 إلى عدم وجود علاقة خطية بين متغيرين
- يشير الشكل 1 إلى وجود علاقة خطية إيجابية تمامًا بين متغيرين
غالبًا ما يُشار إليه بـ r ، وهذا الرقم يساعدنا على فهم قوة العلاقة بين متغيرين. كلما ابتعدت r عن الصفر، كلما كانت العلاقة بين المتغيرين أقوى .
ومن المهم أن نلاحظ أن متغيرين يمكن أن يكون لهما علاقة إيجابية قوية أو علاقة سلبية قوية.
الارتباط الإيجابي القوي: عندما تزيد قيمة أحد المتغيرين، تزداد قيمة المتغير الآخر بنفس الطريقة. على سبيل المثال، كلما زاد عدد الساعات التي يقضيها الطالب في الدراسة، زادت درجات الامتحان. هناك علاقة إيجابية قوية بين ساعات الدراسة ودرجات الامتحانات.
ارتباط سلبي قوي: عندما تزيد قيمة أحد المتغيرات تميل قيمة المتغير الآخر إلى الانخفاض. على سبيل المثال، كلما كبرت الدجاجة، قل عدد البيض الذي تميل إلى إنتاجه. عمر الدجاجة وإنتاج البيض لهما علاقة سلبية قوية.
يوضح الجدول التالي القاعدة الأساسية لتفسير قوة العلاقة بين متغيرين بناءً على قيمة r :
القيمة المطلقة لل ص | قوة العلاقة |
---|---|
ص <0.25 | لا علاقة |
0.25 < ص <0.5 | علاقة ضعيفة |
0.5 < ص < 0.75 | علاقات معتدلة |
ص > 0.75 | علاقة قوية |
يعتبر الارتباط بين متغيرين قويا إذا كانت القيمة المطلقة لـ r أكبر من 0.75 . ومع ذلك، فإن تعريف الارتباط “القوي” يمكن أن يختلف من مجال إلى آخر.
طبي
على سبيل المثال، في المجالات الطبية، غالبًا ما يكون تعريف العلاقة “القوية” أقل بكثير. إذا كانت العلاقة بين تناول دواء معين وتقليل النوبات القلبية هي r = 0.3، فقد تعتبر هذه علاقة “إيجابية ضعيفة” في مجالات أخرى، ولكنها مهمة في الطب بما يكفي لتستحق تناول الدواء لتقليل فرص الإصابة بالنوبات القلبية. الإصابة بنوبة قلبية.
الموارد البشرية
وفي مجال آخر مثل الموارد البشرية، يمكن أيضًا استخدام الارتباطات الأقل في كثير من الأحيان. على سبيل المثال، تبين أن العلاقة بين درجات الكلية والأداء الوظيفي تبلغ تقريبًا r = 0.16 . هذا رقم منخفض جدًا، لكنه مهم بدرجة كافية بحيث يجب على الشركة على الأقل أخذه بعين الاعتبار أثناء عملية المقابلة.
تكنولوجيا
وفي مجال مثل التكنولوجيا، قد تحتاج العلاقة بين المتغيرات إلى أن تكون أعلى بكثير في بعض الحالات حتى تعتبر “قوية”. على سبيل المثال، إذا قامت إحدى الشركات بإنشاء سيارة ذاتية القيادة وكان الارتباط بين قرارات انعطاف السيارة واحتمال وقوع حادث هو r = 0.95 ، فمن المحتمل أن يكون هذا منخفضًا جدًا بحيث لا يمكن اعتبار السيارة آمنة نظرًا لنتيجة تصنيع سيارة ذاتية القيادة. السيارة ذاتية القيادة هي r = 0.95. القرار السيئ يمكن أن يكون قاتلاً.
عرض الارتباطات
بغض النظر عن المجال الذي تعمل فيه، من المفيد إنشاء مخطط مبعثر للمتغيرين اللذين تدرسهما حتى تتمكن على الأقل من فحص العلاقة بينهما بصريًا.
على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية التي توضح طول ووزن 12 فردًا:
من الصعب بعض الشيء فهم العلاقة بين هذين المتغيرين بمجرد النظر إلى البيانات الأولية. ومع ذلك، فمن الأسهل بكثير فهم العلاقة إذا أنشأنا مخططًا مبعثرًا بالارتفاع على المحور السيني والوزن على المحور الصادي:
ومن الواضح أن هناك علاقة إيجابية بين المتغيرين.
يعد إنشاء سحابة نقطية فكرة جيدة لسببين آخرين:
(1) يتيح لك مخطط التشتت تحديد القيم المتطرفة التي تؤثر على الارتباط.
يمكن للقيمة المتطرفة أن تغير بشكل كبير معامل ارتباط بيرسون. خذ بعين الاعتبار المثال أدناه، حيث يكون للمتغيرين X و Y معامل ارتباط بيرسون r = 0.00 .
لكن تخيل الآن أن لدينا قيمة متطرفة في مجموعة البيانات:
يؤدي هذا الخارج إلى أن يكون الارتباط r = 0.878 . تعمل نقطة البيانات الفردية هذه على تغيير الارتباط تمامًا وتجعله يبدو كما لو كانت هناك علاقة قوية بين المتغيرين X و Y ، في حين أنه لا يوجد ذلك بالفعل.
(2) يمكن أن يساعدك مخطط التشتت في تحديد العلاقات غير الخطية بين المتغيرات.
يخبرنا معامل ارتباط بيرسون ببساطة ما إذا كان هناك متغيرين مرتبطين خطيًا . ولكن حتى لو أخبرنا معامل ارتباط بيرسون أن متغيرين غير مرتبطين، فمن الممكن أن يكون بينهما نوع من العلاقة غير الخطية. وهذا سبب آخر يجعل من المفيد إنشاء مخطط مبعثر.
على سبيل المثال، ضع في اعتبارك مخطط التشتت أدناه بين المتغيرين X و Y ، حيث يكون الارتباط بينهما r = 0.00 .
من الواضح أن المتغيرات ليس لها علاقة خطية، لكن لديها علاقة غير خطية: قيم y هي ببساطة قيم x مربعة. لا يمكن لمعامل الارتباط وحده اكتشاف هذه العلاقة، لكن مخطط التشتت يمكنه ذلك.
خاتمة
في ملخص:
- بشكل عام، يعتبر الارتباط الأكبر من 0.75 ارتباطًا “قويًا” بين متغيرين.
- ومع ذلك، فإن هذه القاعدة الأساسية يمكن أن تختلف من منطقة إلى أخرى. على سبيل المثال، يمكن اعتبار الارتباط الأضعف بكثير قويًا في المجال الطبي مقارنة بالمجال التكنولوجي. من الأفضل استخدام الخبرة الخاصة بالمجال لتحديد ما يعتبر قويًا.
- عند استخدام الارتباط لوصف العلاقة بين متغيرين، من المفيد أيضًا إنشاء مخطط تبعثر حتى تتمكن من تحديد القيم المتطرفة في مجموعة البيانات بالإضافة إلى العلاقة غير الخطية المحتملة.
مصادر إضافية
ما الذي يعتبر ارتباطًا “ضعيفًا”؟
حاسبة مصفوفة الارتباط
كيفية قراءة مصفوفة الارتباط