كيفية إجراء تحويل box-cox في sas
يعد تحويل box-cox طريقة شائعة الاستخدام لتحويل مجموعة بيانات غير موزعة بشكل طبيعي إلى مجموعة موزعة بشكل طبيعي .
الفكرة الأساسية وراء هذه الطريقة هي إيجاد قيمة لـ lect بحيث تكون البيانات المحولة قريبة قدر الإمكان من التوزيع الطبيعي، باستخدام الصيغة التالية:
- y() = (y – 1) / إذا y ≠ 0
- y(lect) = log(y) إذا كانت y = 0
يمكننا تحديد القيمة المثلى لاستخدامها في α في SAS باستخدام إجراء PROC TRANSREG .
يوضح المثال التالي كيفية استخدام هذا الإجراء عمليًا.
مثال: تحويل Box-Cox في SAS
لنفترض أن لدينا مجموعة البيانات التالية في SAS:
/*create dataset*/ data my_data; input xy; datalines ; 7 1 7 1 8 1 3 2 2 2 4 2 4 2 6 2 6 2 7 3 5 3 3 3 3 6 5 7 8 8 ; run; /*view dataset*/ proc print data =my_data;
لنفترض أننا نستخدم PROC REG لملاءمة نموذج انحدار خطي بسيط لمجموعة البيانات هذه، باستخدام x كمتغير متوقع و y كمتغير الاستجابة.
/*fit simple linear regression model*/ proc reg data =my_data; model y = x; run ;
في المخططات التشخيصية للمخرجات، يمكننا عرض المخطط المتبقي مقابل المخطط الكمي (المؤامرة الموجودة في أقصى اليسار في الصف الأوسط) لمعرفة ما إذا كانت البقايا موزعة بشكل طبيعي تقريبًا في النموذج:
إذا كانت البقايا تقع تقريبًا على طول الخط القطري الأيمن للرسم البياني، فإننا نفترض عمومًا أن البقايا يتم توزيعها بشكل طبيعي.
من الرسم البياني يمكننا أن نرى أن البقايا لا تتبع الخط القطري المستقيم كثيرًا.
يشير هذا إلى أن متغير الاستجابة في نموذج الانحدار من المحتمل ألا يتم توزيعه بشكل طبيعي.
بما أن متغير الاستجابة لا يتم توزيعه بشكل طبيعي، فيمكننا استخدام PROC TRANSREG لتحديد قيمة π التي يمكننا استخدامها لتحويل متغير الاستجابة بحيث يتم توزيعه بشكل طبيعي أكثر:
/*perform box-cox transformation*/ proc transreg data =my_data; model boxcox (y) = identity (x); run ;
يخبرنا الناتج أن القيمة المحددة لاستخدامها لـ lect هي – 0.5 .
وبالتالي، يمكننا ملاءمة نموذج الانحدار الخطي البسيط عن طريق استبدال متغير الاستجابة الأصلي y بالمتغير y = (y -0.5 – 1) / -0.5 .
يوضح الكود التالي كيفية القيام بذلك:
/*create new dataset that uses box-cox transformation to create new y*/
data new_data;
set my_data;
new_y = (y**(-0.5) - 1) / -0.5;
run ;
/*fit simple linear regression model using new response variable*/
proc reg data =new_data;
model new_y = x;
run ;
في المتبقية مقابل. الرسم الكمي لمخرجات هذا النموذج، يمكننا أن نرى أن البقايا تقع بشكل أوثق على طول الخط القطري المستقيم:
يشير هذا إلى أن بقايا نموذج بوكس كوكس المحول يتم توزيعها بشكل طبيعي أكثر، مما يلبي أحد الافتراضات الرئيسية للانحدار الخطي .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:
كيفية استخدام Proc Univariate لاختبار الحالة الطبيعية في SAS
كيفية إنشاء قطعة أرض متبقية في SAS
كيفية إجراء اختبار ليفين في SAS