ما هو الافتراض الطبيعي في الإحصاء؟
تعتمد العديد من الاختبارات الإحصائية على ما يسمى بافتراض الحالة الطبيعية .
تنص هذه الفرضية على أنه إذا قمنا بجمع العديد من العينات العشوائية المستقلة من مجتمع ما وحساب قيمة الاهتمام (مثل متوسط العينة )، ثم إنشاء رسم بياني لتصور توزيع متوسطات العينة، فيجب أن نلاحظ منحنى الجرس المثالي.
العديد من التقنيات الإحصائية تضع هذا الافتراض حول البيانات، بما في ذلك:
1. اختبار t لعينة واحدة : يفترض أن بيانات العينة موزعة بشكل طبيعي.
2. اختبار t لعينتين : يفترض أن العينتين موزعتان توزيعاً طبيعياً.
3. ANOVA : من المفترض أن يتم توزيع بقايا النموذج بشكل طبيعي.
4. الانحدار الخطي : من المفترض أن يتم توزيع بقايا النموذج بشكل طبيعي.
إذا لم يتم استيفاء هذا الافتراض، تصبح نتائج هذه الاختبارات غير موثوقة ولن نكون قادرين على تعميم استنتاجاتنا المستمدة من عينات البيانات بثقة على إجمالي عدد السكان . ولهذا السبب من المهم التحقق من استيفاء هذه الفرضية.
هناك طريقتان شائعتان للتحقق من استيفاء افتراض الحالة الطبيعية هذا:
1. تصور الحياة الطبيعية
2. إجراء اختبار إحصائي رسمي
تشرح الأقسام التالية الرسوم البيانية المحددة التي يمكنك إنشاؤها والاختبارات الإحصائية المحددة التي يمكنك إجراؤها للتحقق من الحالة الطبيعية.
تصور الوضع الطبيعي
إحدى الطرق السريعة وغير الرسمية للتحقق مما إذا كانت مجموعة البيانات يتم توزيعها بشكل طبيعي هي إنشاء رسم بياني أو مخطط QQ.
1. الرسم البياني
إذا كان الرسم البياني لمجموعة البيانات على شكل جرس تقريبًا، فمن المحتمل أن يتم توزيع البيانات بشكل طبيعي.
2. كيو كيو لاند
مخطط QQ، وهو اختصار لعبارة “Quantile-Quantile”، هو نوع من المخططات التي تعرض الكميات النظرية على طول المحور السيني (أي المكان الذي ستكون فيه بياناتك إذا اتبعت التوزيع الطبيعي) وكميات العينات على طول المحور الصادي. (أي المكان الذي توجد فيه بياناتك فعليًا).
إذا كانت قيم البيانات تتبع خطًا مستقيمًا تقريبًا يشكل زاوية قدرها 45 درجة، فمن المفترض أن يتم توزيع البيانات بشكل طبيعي.
إجراء اختبار إحصائي رسمي
يمكنك أيضًا إجراء اختبار إحصائي رسمي لتحديد ما إذا كانت مجموعة البيانات يتم توزيعها بشكل طبيعي.
إذا كانت القيمة p للاختبار أقل من مستوى معين من الأهمية (مثل α = 0.05)، فهذا يعني أن لديك أدلة كافية للقول بأن البيانات لا يتم توزيعها بشكل طبيعي.
هناك ثلاثة اختبارات إحصائية تستخدم عادة لاختبار الحالة الطبيعية:
1. اختبار جارك بيرا
- كيفية إجراء اختبار جارك بيرا في إكسيل
- كيفية إجراء اختبار Jarque-Bera في R
- كيفية إجراء اختبار Jarque-Bera في بايثون
2. اختبار شابيرو ويلك
3. اختبار كولموجوروف-سميرنوف
- كيفية إجراء اختبار كولموجوروف-سميرنوف في إكسيل
- كيفية إجراء اختبار Kolmogorov-Smirnov في R
- كيفية إجراء اختبار Kolmogorov-Smirnov في بايثون
ماذا تفعل إذا تم انتهاك افتراض الحياة الطبيعية
إذا تبين أن بياناتك لا يتم توزيعها بشكل طبيعي، فلديك خياران:
1. تحويل البيانات.
أحد الخيارات هو ببساطة تحويل البيانات لجعلها موزعة بشكل أكثر طبيعية. تشمل التحولات الشائعة ما يلي:
- تحويل السجل: تحويل البيانات من y إلى log(y) .
- تحويل الجذر التربيعي: تحويل البيانات من y إلى √y
- تحويل الجذر التكعيبي: تحويل البيانات من y إلى y 1/3
- تحويل Box-Cox: تحويل البيانات باستخدام إجراء Box-Cox
ومن خلال إجراء هذه التحويلات، يصبح توزيع قيم البيانات بشكل عام أكثر توزيعًا بشكل طبيعي.
2. إجراء اختبار غير معلمي
تسمى الاختبارات الإحصائية التي تجعل افتراض الحالة الطبيعية الاختبارات البارامترية . ولكن هناك أيضًا مجموعة من الاختبارات غير البارامترية التي لا تفترض هذا الوضع الطبيعي.
إذا تبين أن بياناتك لا يتم توزيعها بشكل طبيعي، فيمكنك ببساطة إجراء اختبار غير معلمي. فيما يلي بعض الإصدارات غير البارامترية من الاختبارات الإحصائية الشائعة:
اختبار البارامترية | معادل غير معلمي |
---|---|
عينة من اختبار t | عينة من اختبار رتبة موقعة ويلكوكسون |
اختبار t لعينتين | اختبار مان ويتني يو |
اختبار t للعينات المقترنة | وقعت عينتان من اختبار رتبة ويلكوكسون |
اتجاه واحد أنوفا | اختبار كروسكال-واليس |
كل من هذه الاختبارات غير المعلمية يجعل من الممكن إجراء اختبار إحصائي دون استيفاء الافتراض الطبيعي.
مصادر إضافية
الفرضيات الأربع التي تمت صياغتها في اختبار T
الافتراضات الأربعة للانحدار الخطي
الفرضيات الأربع لتحليل التباين (ANOVA).