ما هي النتيجة z المعدلة؟ (التعريف & #038؛ مثال)
في الإحصائيات، تخبرنا النتيجة z عن عدد الانحرافات المعيارية للقيمة عن المتوسط . نستخدم الصيغة التالية لحساب درجة z:
النتيجة Z = (x i – μ) / σ
ذهب:
- xi : قيمة بيانات واحدة
- μ: متوسط مجموعة البيانات
- σ : الانحراف المعياري لمجموعة البيانات
غالبًا ما تُستخدم درجات Z للكشف عن القيم المتطرفة في مجموعة البيانات. على سبيل المثال، غالبًا ما تعتبر الملاحظات ذات درجة z أقل من -3 أو أكبر من 3 قيمًا متطرفة.
ومع ذلك، يمكن أن تتأثر درجات z بقيم البيانات الكبيرة أو الصغيرة بشكل غير عادي. هذا هو السبب في أن الطريقة الأكثر قوة لاكتشاف القيم المتطرفة هي استخدام z-score المعدلة ، والتي يتم حسابها على النحو التالي:
النتيجة z المعدلة = 0.6745 (x i – x̃) / MAD
ذهب:
- xi : قيمة بيانات واحدة
- x̃: متوسط مجموعة البيانات
- MAD: متوسط الانحراف المطلق لمجموعة البيانات
تعد درجة z المعدلة أكثر قوة لأنها تستخدم الوسيط لحساب درجات z، على عكس المتوسط، المعروف أنه يتأثر بالقيم المتطرفة .
يوصي Iglewicz وHoaglin بأن يتم تصنيف القيم ذات درجات z المعدلة أقل من -3.5 أو أكبر من 3.5 على أنها قيم متطرفة محتملة.
يوضح المثال التالي خطوة بخطوة كيفية حساب درجات z المعدلة لمجموعة بيانات معينة.
الخطوة 1: إنشاء البيانات
لنفترض أن لدينا مجموعة البيانات التالية التي تحتوي على 16 قيمة:
الخطوة 2: البحث عن الوسيط
بعد ذلك، سوف نجد الوسيط. يمثل هذا نقطة المنتصف لمجموعة البيانات، والتي تبين أنها 16 .
الخطوة 3: أوجد الفرق المطلق بين كل قيمة والوسيط
بعد ذلك، سنوجد الفرق المطلق بين كل قيمة بيانات فردية والوسيط. على سبيل المثال، يتم حساب الفرق المطلق بين قيمة البيانات الأولى والوسيط على النحو التالي:
الفرق المطلق = |6 – 16| = 10
يمكننا استخدام نفس الصيغة لحساب الفرق المطلق بين كل قيمة بيانات فردية والوسيط:
الخطوة 4: العثور على الانحراف المتوسط المطلق
بعد ذلك، سوف نجد الانحراف المتوسط المطلق. هذا هو متوسط العمود الثاني، والذي يساوي 8 .
الخطوة 5: ابحث عن درجة Z المعدلة لكل قيمة بيانات
أخيرًا، يمكننا حساب درجة z المعدلة لكل قيمة بيانات باستخدام الصيغة التالية:
النتيجة z المعدلة = 0.6745 (x i – x̃) / MAD
على سبيل المثال، يتم حساب درجة z المعدلة لقيمة البيانات الأولى على النحو التالي:
النتيجة المعيارية المعدلة = 0.6745*(6-16) / 8 = -0.843
يمكننا تكرار هذه الصيغة لكل قيمة في مجموعة البيانات:
يمكننا أن نرى أنه لا توجد قيمة في مجموعة البيانات تحتوي على درجة z معدلة أقل من -3.5 أو أكبر من 3.5، لذلك نحن لا نصنف أي قيمة في مجموعة البيانات هذه على أنها قيمة متطرفة محتملة.
كيفية التعامل مع القيم المتطرفة
في حالة وجود قيمة متطرفة في مجموعة البيانات الخاصة بك، فلديك عدة خيارات:
- تأكد من أن القيمة المتطرفة ليست نتيجة لخطأ في إدخال البيانات. في بعض الأحيان يقوم الفرد ببساطة بإدخال قيمة بيانات خاطئة أثناء حفظ البيانات. في حالة وجود قيمة خارجية، تحقق أولاً من إدخال القيمة بشكل صحيح وأنها ليست خطأ.
- قم بتعيين قيمة جديدة للقيمة المتطرفة . إذا تبين أن القيمة المتطرفة هي نتيجة لخطأ في إدخال البيانات، فيمكنك أن تقرر تعيين قيمة جديدة لها مثل المتوسط أو الوسيط لمجموعة البيانات.
- إزالة الخارجة. إذا كانت القيمة قيمة متطرفة حقًا، فيمكنك اختيار إزالتها إذا كان لها تأثير كبير على تحليلك الإجمالي. فقط تأكد من الإشارة في تقريرك أو تحليلك النهائي إلى أنك قمت بإزالة القيم المتطرفة.