كيفية إنشاء متغيرات وهمية في sas (مع مثال)
المتغير الوهمي هو نوع من المتغيرات التي نقوم بإنشائها في تحليل الانحدار حتى نتمكن من تمثيل متغير فئوي كمتغير رقمي يأخذ إحدى القيمتين: صفر أو واحد.
على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية ونريد استخدام العمر والحالة الاجتماعية للتنبؤ بالدخل :
لاستخدام الحالة الاجتماعية كمتغير متوقع في نموذج الانحدار، نحتاج إلى تحويله إلى متغير وهمي.
نظرًا لأن هذا متغير فئة حاليًا يمكن أن يأخذ ثلاث قيم مختلفة (“أعزب” أو “متزوج” أو “مطلق”)، فنحن بحاجة إلى إنشاء k -1 = 3-1 = 2 متغيرات وهمية.
لإنشاء هذا المتغير الوهمي، يمكننا ترك “مفرد” كقيمة أساسية لأنه يظهر في أغلب الأحيان. إذن، إليك كيفية تحويل الحالة الاجتماعية إلى متغيرات وهمية:
يوضح المثال التالي كيفية إنشاء متغيرات وهمية لمجموعة البيانات المحددة هذه في SAS.
مثال: إنشاء متغيرات وهمية في SAS
أولاً، لنقم بإنشاء مجموعة البيانات التالية في SAS:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
بعد ذلك، يمكننا استخدام عبارات IF-THEN-ELSE لإنشاء متغيرات وهمية لمتغير الحالة :
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
لاحظ أن قيم المتغيرين الوهميين ( المتزوجين والمطلقين ) تطابق القيم التي حسبناها في المثال التمهيدي.
يمكننا بعد ذلك استخدام هذه المتغيرات الوهمية في نموذج الانحدار إذا أردنا ذلك، حيث أن كلاهما رقمي.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:
كيفية استخدام ملخص الإجراء في SAS
كيفية استخدام Proc Tabulate في SAS
كيفية إعادة تسمية المتغيرات في SAS
كيفية إنشاء متغيرات جديدة في SAS