ما هو افتراض الاستقلال في الإحصاء؟
تفترض العديد من الاختبارات الإحصائية أن الملاحظات مستقلة. وهذا يعني أنه لا توجد ملاحظات في مجموعة البيانات مرتبطة ببعضها البعض أو تؤثر على بعضها البعض بأي شكل من الأشكال.
على سبيل المثال، لنفترض أننا نريد اختبار ما إذا كان هناك اختلاف في متوسط الوزن بين نوعين من القطط أم لا. إذا قمنا بقياس أوزان 10 قطط من النوع A و10 قطط من النوع B، فسنخالف افتراض الاستقلال إذا جاءت كل مجموعة من مجموعات القطط من نفس القمامة.
من الممكن أن القطة الأم من النوع أ كانت لديها قطط صغيرة ذات وزن منخفض بينما كانت القطة الأم من النوع ب تمتلك قططًا ثقيلة الوزن. وفي هذا الصدد، فإن ملاحظات كل عينة ليست مستقلة عن بعضها البعض.
هناك ثلاثة أنواع شائعة من الاختبارات الإحصائية التي تجعل افتراض الاستقلال هذا:
وفي الأقسام التالية، نوضح سبب وضع هذا الافتراض لكل نوع من الاختبارات بالإضافة إلى كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه أم لا.
افتراض الاستقلال في اختبارات t
يتم استخدام اختبار t المكون من عينتين لاختبار ما إذا كانت متوسطات مجتمعين متساويتين أم لا.
الافتراض: يفترض هذا النوع من الاختبارات أن الملاحظات داخل كل عينة مستقلة عن بعضها البعض وأن الملاحظات بين العينات مستقلة أيضًا عن بعضها البعض.
اختبار هذه الفرضية: إن أبسط طريقة لاختبار هذه الفرضية هي التحقق من أن كل ملاحظة تظهر مرة واحدة فقط في كل عينة وأن الملاحظات في كل عينة تم جمعها عن طريق أخذ عينات عشوائية.
افتراض الاستقلال في ANOVA
يتم استخدام ANOVA لتحديد ما إذا كان هناك فرق كبير بين متوسطات ثلاث مجموعات مستقلة أو أكثر أم لا.
الافتراض: تفترض تحليل التباين (ANOVA) أن الملاحظات في كل مجموعة مستقلة عن بعضها البعض وأن الملاحظات داخل المجموعات تم الحصول عليها بواسطة عينة عشوائية.
اختبار هذه الفرضية: على غرار اختبار t، فإن أبسط طريقة لاختبار هذه الفرضية هي التحقق من أن كل ملاحظة تظهر مرة واحدة فقط في كل عينة وأن الملاحظات في كل عينة تم جمعها عن طريق أخذ عينات عشوائية.
الاستقلال في الانحدار المفترض
يستخدم الانحدار الخطي لفهم العلاقة بين واحد أو أكثر من متغيرات التوقع ومتغير الاستجابة .
الافتراض: يفترض الانحدار الخطي أن بقايا النموذج المجهز مستقلة.
اختبار هذه الفرضية: أسهل طريقة لاختبار هذه الفرضية هي النظر إلى مخطط السلاسل الزمنية للبقايا، وهو مخطط للبقايا مقابل الوقت. من الناحية المثالية، ينبغي أن تقع معظم الارتباطات الذاتية المتبقية ضمن نطاقات الثقة 95% حول الصفر، والتي تقع تقريبًا +/- 2 على الجذر التربيعي لـ n ، حيث n هو حجم العينة. يمكنك أيضًا اختبار ما إذا كان هذا الافتراض قد تم تحقيقه رسميًا باستخدام اختبار Durbin-Watson .
المصادر المشتركة لعدم الاستقلال
هناك ثلاثة مصادر شائعة لعدم الاستقلال في مجموعات البيانات:
1. يتم إغلاق الملاحظات معًا في الوقت المناسب.
على سبيل المثال، قد يقوم الباحث بجمع بيانات حول متوسط سرعة السيارات على طريق معين. إذا اختار تتبع السرعات في المساء، فقد يجد أن متوسط السرعة أعلى بكثير مما توقعه وذلك ببساطة لأن كل سائق يسرع إلى المنزل من العمل.
تنتهك هذه البيانات الافتراض بأن كل ملاحظة مستقلة. وبما أنه تمت ملاحظة كل ملاحظة في نفس الوقت من اليوم، فمن المرجح أن تكون سرعة كل سيارة متشابهة.
2. الملاحظات مغلقة معًا في الفضاء.
على سبيل المثال، قد يقوم الباحث بجمع بيانات الدخل السنوي من الأشخاص الذين يعيشون جميعًا في نفس الحي ذي الدخل المرتفع لأنه مناسب.
وفي هذا الصدد، من المرجح أن يكون لجميع الأشخاص المشمولين في عينة البيانات دخل مماثل لأنهم جميعا يعيشون على مقربة من بعضهم البعض. وهذا ينتهك الافتراض بأن كل ملاحظة مستقلة.
3. تظهر الملاحظات عدة مرات في نفس مجموعة البيانات.
على سبيل المثال، قد يحتاج الباحث إلى جمع بيانات عن 50 فردًا، ولكنه بدلاً من ذلك يقرر جمع بيانات عن 25 فردًا مرتين لأن ذلك أسهل بكثير.
وهذا ينتهك افتراض الاستقلال لأن كل ملاحظة في مجموعة البيانات ستكون مرتبطة بنفسها.
كيفية تجنب انتهاك افتراض الاستقلال
إن أبسط طريقة لتجنب انتهاك افتراض الاستقلال هي ببساطة استخدام أخذ عينات عشوائية بسيطة عند الحصول على عينة من مجتمع ما.
باستخدام هذه الطريقة، يكون لكل فرد في المجموعة السكانية محل الاهتمام فرصة متساوية لإدراجه في العينة.
على سبيل المثال، إذا كان عدد السكان محل الاهتمام لدينا يحتوي على 10000 فرد، فيمكننا تعيين رقم عشوائيًا لكل فرد في المجتمع ثم استخدام منشئ أرقام عشوائية لتحديد 40 رقمًا عشوائيًا. سيتم بعد ذلك تضمين الأفراد الذين يطابقون هذه الأرقام في العينة.
باستخدام هذه الطريقة، نقوم بتقليل فرص اختيار شخصين قد يكونا قريبين جدًا من بعضهما البعض أو قد يكونا مرتبطين بطريقة ما.
وهذا يتناقض بشكل مباشر مع طرق أخذ العينات الأخرى مثل:
- أخذ العينات الملائمة: تضمين أفراد في العينة يسهل الوصول إليهم.
- أخذ العينات الطوعية: يشمل الأفراد في العينة الذين يتطوعون لإدراجهم.
وباستخدام أسلوب أخذ العينات العشوائية، يمكننا تقليل فرص انتهاك افتراض الاستقلالية.
مصادر إضافية
الفرضيات الأربع التي تمت صياغتها في اختبار T
الافتراضات الأربعة للانحدار الخطي
الفرضيات الثلاث لتحليل التباين (ANOVA).
ما هي العينة التمثيلية ولماذا هي مهمة؟