كيفية تطبيع البيانات في sas
“تطبيع” مجموعة من قيم البيانات يعني قياس القيم بحيث يكون متوسط جميع القيم 0 والانحراف المعياري هو 1.
يشرح هذا البرنامج التعليمي كيفية تسوية البيانات في SAS.
مثال: كيفية تطبيع البيانات في SAS
لنفترض أن لدينا مجموعة البيانات التالية:
أكمل الخطوات التالية لتطبيع مجموعة قيم البيانات هذه في SAS.
الخطوة 1: إنشاء مجموعة البيانات
أولاً، دعونا نستخدم الكود التالي لإنشاء مجموعة البيانات في SAS:
/*create dataset*/ data original_data; input values; datalines ; 12 14 15 15 16 17 18 20 24 25 26 29 32 34 37 ; run ; /*view mean and standard deviation of dataset*/ proc means data =original_data Mean StdDev ndec= 3 ; var values; run ;
من النتيجة يمكننا أن نرى أن متوسط مجموعة البيانات هو 22.267 والانحراف المعياري هو 7.968 .
الخطوة 2: تطبيع مجموعة البيانات
بعد ذلك، سوف نستخدم proc stdize لتطبيع مجموعة البيانات:
/*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
var values;
run ;
/*print normalized dataset*/
proc print data =normalized_data;
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ;
var values;
run ;
من النتيجة، يمكننا أن نرى أن متوسط مجموعة البيانات المقيسة هو 0 والانحراف المعياري هو 1 .
الخطوة 3: تفسير البيانات التي تمت تسويتها
استخدمت SAS الصيغة التالية لتطبيع قيم البيانات:
القيمة المقيسة = (x – x ) / s
ذهب:
- س = قيمة البيانات
- x = متوسط مجموعة البيانات
- s = الانحراف المعياري لمجموعة البيانات
تخبرنا كل قيمة تم تسويتها بعدد الانحرافات المعيارية بين قيمة البيانات الأصلية والمتوسط.
على سبيل المثال، ضع في اعتبارك نقطة البيانات “12” في مجموعة البيانات الأصلية لدينا. كان متوسط العينة الأصلي 22.267 وكان الانحراف المعياري للعينة الأصلية 7.968.
وتبين أن القيمة الطبيعية لـ “12” هي -1.288، ويتم حسابها على النحو التالي:
القيمة الطبيعية = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288
يخبرنا هذا أن القيمة “12” أقل بمقدار 1.288 انحرافًا معياريًا عن متوسط مجموعة البيانات الأصلية.
يمكن أن تساعدنا كل من القيم المقيسة في مجموعة البيانات في فهم مدى قرب أو بعد قيمة بيانات معينة عن المتوسط.
تشير القيمة المقيسة الصغيرة إلى أن القيمة قريبة من المتوسط بينما تشير القيمة المقيسة الكبيرة إلى أن القيمة بعيدة عن المتوسط.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:
كيفية استخدام ملخص الإجراء في SAS
كيفية حساب الارتباط في SAS
كيفية إنشاء الجداول التكرارية في SAS