كيفية تطبيع البيانات بين -1 و 1
لتطبيع القيم في مجموعة بيانات بين -1 و1، يمكنك استخدام الصيغة التالية:
ض i = 2 * ((x i – x min ) / (x max – x min )) – 1
ذهب:
- z i : القيمة المقيسة في مجموعة البيانات
- x i : القيمة i لمجموعة البيانات
- x min : الحد الأدنى للقيمة في مجموعة البيانات
- x max : الحد الأقصى للقيمة في مجموعة البيانات
على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية:
الحد الأدنى للقيمة في مجموعة البيانات هو 13 والحد الأقصى للقيمة هو 71.
لتطبيع القيمة الأولى 13 ، سنطبق الصيغة التي تمت مشاركتها مسبقًا:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
لتطبيع القيمة الثانية 16 ، سنستخدم نفس الصيغة:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897
لتطبيع القيمة الثالثة 19 ، سنستخدم نفس الصيغة:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793
يمكننا استخدام هذه الصيغة نفسها لتطبيع كل قيمة في مجموعة البيانات الأصلية بين -1 و1:
تتراوح الآن كل قيمة في مجموعة البيانات التي تمت تسويتها بين -1 و1.
باستخدام طريقة التسوية هذه، ستكون العبارات التالية صحيحة دائمًا:
- ستكون القيمة التي تمت تسويتها للحد الأدنى للقيمة في مجموعة البيانات دائمًا -1.
- ستكون القيمة المقيسة للقيمة القصوى في مجموعة البيانات دائمًا 1.
- ستكون القيم المقيسة لجميع القيم الأخرى في مجموعة البيانات بين -1 و1.
متى يتم تطبيع البيانات
في كثير من الأحيان نقوم بتوحيد المتغيرات عندما نقوم بنوع من التحليل الذي لدينا فيه متغيرات متعددة يتم قياسها بمقاييس مختلفة ونريد أن يكون لكل متغير نفس النطاق.
وهذا يمنع متغير واحد من التأثير بشكل كبير، خاصة إذا تم قياسه بوحدات مختلفة (أي إذا تم قياس متغير واحد بالبوصة وآخر بالياردة).
لاحظ أيضًا أن طريقة التسوية التي استخدمناها هنا ليست سوى خيار واحد ممكن.
في بعض الحالات، يكون من المنطقي تسوية المتغيرات بين 0 و1، أو حتى بين 0 و100.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية إجراء أنواع أخرى من التسوية:
كيفية تطبيع البيانات بين 0 و 1
كيفية تطبيع البيانات بين 0 و 100