فهم التغايرية في تحليل الانحدار
في تحليل الانحدار، تشير التغايرية (التي تُكتب أحيانًا التغايرية) إلى التشتت غير المتكافئ للمخلفات أو مصطلحات الخطأ. وبتعبير أدق، هذه هي الحالة التي يوجد فيها تغيير منهجي في توزيع البقايا على مدى القيم المقاسة.
تعد التغايرية مشكلة لأن انحدار المربعات الصغرى العادية (OLS) يفترض أن البقايا تأتي من مجتمع لديه المثلية ، مما يعني التباين المستمر.
عندما تكون التغايرية موجودة في تحليل الانحدار، يصبح من الصعب تصديق نتائج التحليل. على وجه التحديد، تزيد التغايرية من التباين في تقديرات معامل الانحدار، لكن نموذج الانحدار لا يأخذ في الاعتبار ذلك.
وهذا يجعل من الأرجح أن يدعي نموذج الانحدار أن المصطلح الموجود في النموذج له دلالة إحصائية، في حين أنه ليس كذلك في الواقع.
يشرح هذا البرنامج التعليمي كيفية اكتشاف عدم التباين، وأسباب عدم التباين، والطرق المحتملة لحل مشكلة عدم التباين.
كيفية الكشف عن التغايرية
إن أبسط طريقة للكشف عن التغايرية هي استخدام القيمة المجهزة/المؤامرة المتبقية .
بمجرد ملاءمة خط الانحدار لمجموعة بيانات، يمكنك إنشاء مخطط تبعثر يوضح القيم المجهزة للنموذج مقابل القيم المتبقية لتلك القيم المجهزة.
يُظهر مخطط التشتت أدناه مخططًا نموذجيًا للقيمة المجهزة مقابل القيمة المتبقية التي توجد فيها التغايرية.
لاحظ كيف تنتشر البقايا أكثر فأكثر مع زيادة القيم المجهزة. هذا الشكل “المخروطي” هو علامة واضحة على التغايرية.
ما هي أسباب التغايرية؟
تحدث التغايرية بشكل طبيعي في مجموعات البيانات حيث يوجد نطاق واسع من قيم البيانات المرصودة. على سبيل المثال:
- خذ بعين الاعتبار مجموعة بيانات تتضمن الدخل والنفقات السنوية لـ 100000 شخص في الولايات المتحدة. بالنسبة للأشخاص ذوي الدخل المنخفض، سيكون تقلب النفقات المقابلة أقل، لأن هؤلاء الأشخاص من المرجح أن يكون لديهم ما يكفي من المال فقط لدفع ثمن الضروريات. بالنسبة للأفراد ذوي الدخل الأعلى، سيكون هناك تباين أكبر في النفقات المقابلة لأن هؤلاء الأفراد سيكون لديهم المزيد من المال لإنفاقه إذا رغبوا في ذلك. سيختار بعض الأشخاص ذوي الدخل المرتفع إنفاق معظم دخلهم، بينما سيختار آخرون أن يكونوا مقتصدين وينفقوا جزءًا فقط. ولذلك، فإن تقلب الإنفاق بين هؤلاء الأفراد ذوي الدخل المرتفع سيكون أعلى بطبيعته.
- خذ بعين الاعتبار مجموعة بيانات تتضمن عدد السكان وعدد بائعي الزهور في 1000 مدينة مختلفة في الولايات المتحدة. بالنسبة للمدن ذات الكثافة السكانية المنخفضة، قد يكون من الشائع وجود بائع زهور واحد أو اثنين فقط. ولكن في المدن الأكثر اكتظاظا بالسكان، سيكون عدد بائعي الزهور أكثر تنوعا. يمكن أن تضم هذه المدن ما بين 10 إلى 100 متجر. وهذا يعني أنه عندما نقوم بإنشاء تحليل الانحدار واستخدام السكان للتنبؤ بعدد بائعي الزهور، سيكون هناك بطبيعته تباين أكبر في القيم المتبقية للمدن الأكثر اكتظاظًا بالسكان.
بعض مجموعات البيانات هي ببساطة أكثر عرضة للتغايرية من غيرها.
كيفية إصلاح التغايرية
هناك ثلاث طرق شائعة لتصحيح عدم التجانس:
1. تحويل المتغير التابع
إحدى الطرق لتصحيح التغايرية هي تحويل المتغير التابع بطريقة ما. التحويل الشائع هو ببساطة أخذ سجل المتغير التابع.
على سبيل المثال، إذا استخدمنا حجم السكان (متغير مستقل) للتنبؤ بعدد بائعي الزهور في مدينة ما (متغير تابع)، فيمكننا بدلاً من ذلك محاولة استخدام حجم السكان للتنبؤ بلوغاريتم عدد بائعي الزهور في مدينة ما.
غالبًا ما يؤدي استخدام سجل المتغير التابع، بدلاً من المتغير التابع الأصلي، إلى اختفاء التغايرية.
2. إعادة تعريف المتغير التابع
هناك طريقة أخرى لتصحيح التغايرية وهي إعادة تعريف المتغير التابع. إحدى الطرق الشائعة للقيام بذلك هي استخدام معدل للمتغير التابع، بدلاً من القيمة الأولية.
على سبيل المثال، بدلاً من استخدام حجم السكان للتنبؤ بعدد بائعي الزهور في المدينة، يمكننا استخدام حجم السكان للتنبؤ بعدد بائعي الزهور للفرد.
في معظم الحالات، يؤدي هذا إلى تقليل التباين الذي يحدث بشكل طبيعي ضمن مجموعات سكانية أكبر نظرًا لأننا نقيس عدد بائعي الزهور لكل شخص، بدلاً من عدد بائعي الزهور نفسه.
3. استخدم الانحدار المرجح
هناك طريقة أخرى لتصحيح التغايرية وهي استخدام الانحدار المرجح. يقوم هذا النوع من الانحدار بتعيين وزن لكل نقطة بيانات بناءً على تباين قيمتها المجهزة.
بشكل أساسي، يعطي هذا أوزانًا منخفضة لنقاط البيانات التي تحتوي على تباينات أعلى، مما يقلل من مربعاتها المتبقية. عند استخدام الأوزان المناسبة، يمكن أن يؤدي ذلك إلى القضاء على مشكلة عدم التجانس.
خاتمة
تعتبر التغايرية مشكلة شائعة إلى حد ما عندما يتعلق الأمر بتحليل الانحدار، حيث أن العديد من مجموعات البيانات تخضع بطبيعتها للتباين غير الثابت.
ومع ذلك، باستخدام قطعة أرض ذات قيمة مُجهزة مقابل قطعة أرض متبقية ، قد يكون من السهل جدًا اكتشاف التغايرية.
ومن خلال تحويل المتغير التابع، أو إعادة تعريف المتغير التابع، أو استخدام الانحدار المرجح، يمكن في كثير من الأحيان القضاء على مشكلة التغايرية.