القيم غير النمطية (القيم المتطرفة)

تشرح هذه المقالة ما هي القيم المتطرفة وكيفية حسابها. بالإضافة إلى ذلك، يمكنك حساب القيم المتطرفة لأي عينة بيانات باستخدام الآلة الحاسبة عبر الإنترنت.

ما هي القيم المتطرفة؟

في الإحصائيات، القيم المتطرفة ، والتي تسمى أيضًا القيم المتطرفة أو القيم المتطرفة ، هي قيم تختلف بشكل كبير عن بقية مجموعة البيانات. بمعنى آخر، القيمة المتطرفة هي قيمة غير طبيعية تختلف تمامًا عن بقية القيم في العينة.

من المهم تحديد القيم المتطرفة في العينة لأنها يمكن أن تؤثر بشكل كبير على حساب القياسات الإحصائية.

على سبيل المثال، إذا كانت لدينا سلسلة البيانات [1، 3، 5، 2، 79، 4، 8، 6]، فمن الواضح أن الرقم 79 هو رقم شاذ. لأن قيمتها أعلى بكثير من بقية البيانات. في هذه الحالة، المتوسط بما في ذلك القيمة المتطرفة هو 13.5، في حين أن المتوسط بدون القيمة المتطرفة سيكون 4.14. كما ترون، تؤثر بالفعل قيمة متطرفة واحدة بشكل كبير على نتيجة القياس الإحصائي.

 1, \ 3, \ 5, \ 2, \ 79, \ 4, \ 8, \ 6 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad \text{Valor at\'ipico: } 79

عادةً ما يتم تمييز القيم المتطرفة بسهولة في مخططات التشتت لأنها معزولة عن بقية البيانات. انظر إلى مخطط التشتت التالي، حيث أن القيمة المتطرفة منفصلة جدًا عن بقية القيم:

مخطط scatterplot من القيم المتطرفة أو غيرها

👉 يمكنك استخدام الآلة الحاسبة أدناه للعثور على القيم المتطرفة لأي مجموعة بيانات.

كيفية حساب القيم المتطرفة

لحساب القيم المتطرفة من عينة بيانات، يجب اتباع الخطوات التالية:

  1. حساب الربعيات من مجموعة البيانات.
  2. احسب المدى الربيعي للبيانات.
  3. القيم غير النمطية (القيم المتطرفة) ستعتبر قيمًا تستوفي أحد الشروط التالية:
    • القيمة أقل من الربع الأول ناقص 1.5 مرة من المدى الربيعي.
    • q

<li style="margin-bottom:15px"> <span style="color:#101010;font-weight: normal;">La valeur est supérieure au troisième quartile plus 1,5 fois l’intervalle interquartile.</span></li>
<p>[latex]q>Q_3+1,5\cdot IQR” title=”Rendered by QuickLaTeX.com” height=”84″ width=”646″ style=”vertical-align: -5px;”></p>
</p>
</ul>
</li>
</ol>
<p style= لذلك، من أجل إزالة القيم المتطرفة من التوزيع الاحتمالي، تحتاج إلى معرفة كيفية حساب الربعين والمدى الربيعي للعينة. إذا كانت لديك أي أسئلة، فإليك رابطين يشرحان بالتفصيل كيفية القيام بذلك:

      في boxplot التالي، يمكنك رؤية قيمتين متطرفتين وفقًا لهذا المعيار ممثلة بيانيًا:

      القيم المتطرفة boxplot

      ملاحظة: ضع في اعتبارك أن هناك عدة معايير لتحديد الحدود التي تعتبر البيانات بعدها قيمًا متطرفة. في هذه المقالة تم اتخاذ معيار اختبار توكي كمرجع لأنه الأكثر استخداما.

      مثال على القيم المتطرفة

      بالنظر إلى تعريف القيم المتطرفة، سنرى في هذا القسم مثالًا عمليًا لكيفية تحديد القيم المتطرفة في سلسلة البيانات.

      • احسب القيم المتطرفة أو القيم المتطرفة من مجموعة البيانات الإحصائية التالية.

      أولاً، نحسب الأرباع الثلاثة لمجموعة البيانات:

      Q_1=4,06

      Q_2=4,38

      Q_3=4,66

      بمجرد العثور على الربيعيات الثلاثة، نجد المدى الربيعي عن طريق طرح الربع 3 ناقص الربع 1:

      IQR=Q_3-Q_1=4,66-4,06=0,6

      والآن نحسب الحدود التي حددتها القيم المتطرفة. للقيام بذلك، نستخدم الصيغ الموضحة في القسم أعلاه:

      Q_1-1,5\cdot IQR=4,06-1,5\cdot 0,6=3,16

      Q_3+1,5\cdot IQR=4,66+1,5\cdot 0,6=5,56

      لذا، إذا كانت أي من القيم أقل من 3.16، فهي قيمة متطرفة. وبالمثل، إذا كانت القيمة أكبر من 5.56، فهي أيضًا قيمة متطرفة.

      في الختام، في هذه الحالة لدينا قيمتان متطرفتان، لأن 3.02 أقل من 3.16 و5.71 أكبر من 5.56.

      \text{Valores at\'ipicos} =\Bigl\{3,02 \ ; \ 5,71\Bigr\}

      حاسبة المتطرفة

      أدخل مجموعة بيانات إحصائية في الآلة الحاسبة التالية لحساب قيمها المتطرفة، إن وجدت. يجب فصل البيانات بمسافة وإدخالها باستخدام النقطة كفاصل عشري.

      أسباب القيم المتطرفة

      هناك عدة أسباب محتملة للقيم المتطرفة، وأكثرها شيوعًا هي:

      • الجهاز المستخدم لإجراء القياسات قد تعطل أو تعرض لحادث.
      • كان الجزء المقاس به عيب نتيجة لسبب غير طبيعي.
      • حدث خطأ في نقل البيانات أو نسخها.
      • لقد حدث خطأ بشري. وبغض النظر عن الاحتياطات المتخذة، فإن الأخطاء البشرية ليست حتمية تمامًا وبالتالي قد تظل القيم غير الطبيعية موجودة.

      هذه هي الأسباب الأكثر شيوعًا، ولكن من الواضح أن السبب قد يكون أي شيء. كما يجب الأخذ في الاعتبار أنه عند إجراء دراسة إحصائية تحتوي على ملاحظات عديدة، فمن الطبيعي أن تظهر بعض القيم المتطرفة.

      ما يجب القيام به مع القيم المتطرفة

      السؤال الشائع عندما نواجه حالة متطرفة هو ماذا يجب أن نفعل بها. هل يجب إزالة القيم المتطرفة من العينة؟

      من المعتقد أنه يجب دائمًا حذف القيم المتطرفة، لأنها بيانات لا تشبه بقية المجموعة. ومع ذلك، على الرغم من أن القيم المتطرفة تؤثر بشكل كبير على نتائج بعض القياسات الإحصائية، فإن هذا لا يعني أنه يجب التخلص منها دائمًا.

      بشكل عام، لا ينبغي إزالة القيم المتطرفة إلا إذا علمنا أن سبب الشذوذ له ما يبرره حقًا ، وبالتالي، فإن هذه القيم المتطرفة هي ملاحظات لا تتطابق مع ما تتم دراسته.

      وهذا مهم بشكل خاص في أحجام العينات الصغيرة، حيث تؤثر القيم المتطرفة بعد ذلك على المقاييس الإحصائية بشكل أكبر.

      على سبيل المثال، إذا تم قياس طول جزء من المنتج لإجراء مراقبة الجودة، فمن المنطقي إذا ظهر نوع آخر من المنتج فجأة وتم قياس نفس الجزء، فإن القيمة المقاسة ستكون مختلفة تمامًا عن القيم السابقة ومن المحتمل أن تكون كذلك يكون غريبا. في هذه الحالة، يمكن استبعاد القيمة المتطرفة لأن سببها معروف ومن المعروف أن البيانات المقاسة ليست جزءًا من المجتمع المراد تحليله.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *