كيفية تحديد القيم المتطرفة في spss


القيمة المتطرفة هي ملاحظة بعيدة بشكل غير طبيعي عن القيم الأخرى في مجموعة البيانات. يمكن أن تكون القيم المتطرفة مشكلة لأنها يمكن أن تؤثر على نتائج التحليل.

يشرح هذا البرنامج التعليمي كيفية تحديد القيم المتطرفة والتعامل معها في برنامج SPSS.

كيفية تحديد القيم المتطرفة في SPSS

لنفترض أن لدينا مجموعة البيانات التالية التي توضح الدخل السنوي (بالآلاف) لـ 15 شخصًا:

إحدى الطرق لتحديد ما إذا كانت القيم المتطرفة موجودة هي إنشاء مخطط مربع لمجموعة البيانات. للقيام بذلك، انقر فوق علامة التبويب تحليل ، ثم الإحصائيات الوصفية ، ثم استكشاف :

في النافذة الجديدة التي تظهر، اسحب الدخل المتغير إلى المربع المسمى قائمة المعالين. ثم انقر فوق الإحصائيات وتأكد من تحديد المربع الموجود بجوار النسب المئوية . ثم انقر فوق “متابعة” . ثم انقر فوق موافق .

بمجرد النقر فوق “موافق” ، سيظهر boxplot:

Boxplot في برنامج SPSS

إذا لم تكن هناك دوائر أو علامات نجمية في أي من طرفي مخطط الصندوق، فهذا يشير إلى عدم وجود قيم متطرفة.

يعتبر SPSS أي قيمة بيانات قيمة متطرفة إذا كانت تقع خارج النطاقات التالية:

  • الربع الثالث + 1.5*المدى الربيعي
  • الربع الأول – 1.5*المدى الربيعي

يمكننا حساب النطاق الربيعي عن طريق أخذ الفرق بين المئين 75 و 25 في الصف المسمى Tukey Hinges في النتيجة:

النطاق الربعي لمفصلات توكي في برنامج SPSS

بالنسبة لمجموعة البيانات هذه، النطاق الربيعي هو 82 – 36 = 46 . وبالتالي، فإن أي قيم خارج النطاقات التالية سيتم اعتبارها قيمًا متطرفة:

  • 82 + 1.5*46 = 151
  • 36 – 1.5*46 = -33

ومن الواضح أن الدخل لا يمكن أن يكون سلبيا، وبالتالي فإن الحد الأدنى في هذا المثال ليس مفيدا. ومع ذلك، فإن أي دخل أعلى من 151 سيعتبر قيمة متطرفة.

على سبيل المثال، لنفترض أن أكبر قيمة في مجموعة البيانات لدينا هي 152 بدلاً من ذلك. إليك المخطط المربع لمجموعة البيانات هذه:

Boxplot مع القيم المتطرفة في SPSS

تشير الدائرة إلى وجود قيمة خارجية في البيانات. يشير الرقم 15 إلى الملاحظة في مجموعة البيانات التي تعتبر غريبة.

يعتبر SPSS أيضًا أي قيمة بيانات قيمة متطرفة إذا كانت تقع خارج النطاقات التالية:

  • الربع الثالث + 3*المدى الربيعي
  • الربع الأول – 3*المدى الربيعي

لذا فإن أي قيم خارج النطاقات التالية ستعتبر قيمًا متطرفة في هذا المثال:

  • 82 + 3*46 = 220
  • 36 – 3*46 = -102

على سبيل المثال، لنفترض أن أكبر قيمة في مجموعة البيانات لدينا هي 221. إليك المخطط المربع لمجموعة البيانات هذه:

متطرف للغاية في boxplot في SPSS

تشير العلامة النجمية (*) إلى وجود قيمة متطرفة في البيانات. ويشير الرقم 15 إلى أي ملاحظة في مجموعة البيانات هي الأكثر متطرفة.

كيفية التعامل مع القيم المتطرفة

في حالة وجود قيمة متطرفة في بياناتك، فلديك عدة خيارات:

1. تأكد من أن القيمة المتطرفة ليست نتيجة لخطأ في إدخال البيانات.

في بعض الأحيان يقوم الفرد ببساطة بإدخال قيمة بيانات خاطئة أثناء حفظ البيانات. في حالة وجود قيمة خارجية، تحقق أولاً من إدخال القيمة بشكل صحيح وأنها ليست خطأ.

2. قم بإزالة القيمة المتطرفة.

إذا كانت القيمة قيمة متطرفة حقًا، فيمكنك اختيار إزالتها إذا كان لها تأثير كبير على تحليلك الإجمالي. فقط تأكد من الإشارة في تقريرك أو تحليلك النهائي إلى أنك قمت بإزالة القيم المتطرفة.

3. قم بتعيين قيمة جديدة للقيمة المتطرفة .

إذا تبين أن القيمة المتطرفة هي نتيجة لخطأ في إدخال البيانات، فيمكنك أن تقرر تعيين قيمة جديدة لها مثل المتوسط أو الوسيط لمجموعة البيانات.

مصادر إضافية

إذا كنت تعمل مع متغيرات متعددة في وقت واحد، فقد ترغب في استخدام مسافة Mahalanobis للكشف عن القيم المتطرفة.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *