كيفية حساب مسافة الطهي في sas
تُستخدم مسافة كوك لتحديد الملاحظات المؤثرة في نموذج الانحدار.
صيغة مسافة كوك هي:
د i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 )
ذهب:
- r i هو i البقايا
- p هو عدد المعاملات في نموذج الانحدار
- MSE هو متوسط الخطأ المربع
- hii هي قيمة الرافعة المالية
بشكل أساسي، تقيس مسافة كوك مدى تغير جميع القيم المجهزة للنموذج عند إزالة الملاحظة i .
كلما كانت قيمة مسافة كوك أكبر، كلما كانت الملاحظة المعطاة أكثر تأثيرًا.
بشكل عام، أي ملاحظة بمسافة كوك أكبر من 4/n (حيث n = إجمالي الملاحظات) تعتبر ذات تأثير كبير.
يوضح المثال التالي كيفية حساب مسافة كوك لكل ملاحظة في نموذج الانحدار في SAS.
مثال: حساب مسافة الطباخ في SAS
لنفترض أن لدينا مجموعة البيانات التالية في SAS:
/*create dataset*/
data my_data;
input xy;
datalines ;
8 41
12 42
12 39
13 37
14 35
16 39
17 45
22 46
24 39
26 49
29 55
30 57
;
run ;
/*view dataset*/
proc print data =my_data;
يمكننا استخدام PROC REG لملاءمة نموذج انحدار خطي بسيط لمجموعة البيانات هذه، ثم استخدام عبارة OUTPUT مع عبارة COOKD لحساب مسافة Cook لكل ملاحظة في نموذج الانحدار:
/*fit simple linear regression model and calculate Cook's distance for each obs*/
proc reg data =my_data;
model y=x;
output out=cooksData cookd =cookd;
run ;
/*print Cook's distance values for each observation*/
proc print data =cooksData;
يعرض جدول النتائج النهائية مجموعة البيانات الأصلية بالإضافة إلى مسافة الطهي لكل ملاحظة:
على سبيل المثال يمكننا أن نرى:
- مسافة كوك للملاحظة الأولى هي 0.36813 .
- مسافة كوك للملاحظة الثانية هي 0.06075 .
- مسافة كوك للملاحظة الثالثة هي 0.00052 .
وما إلى ذلك وهلم جرا.
ينتج عن إجراء PROC REG أيضًا العديد من المخططات التشخيصية في المخرجات ويمكن رؤية مخطط مسافة Cook في هذا المخرج:
يُظهر المحور السيني رقم الملاحظة ويوضح المحور الصادي مسافة كوك لكل ملاحظة.
لاحظ أنه تم وضع خط القطع عند 4/n (في هذه الحالة n = 12، وبالتالي فإن القطع عند 0.33) ويمكننا أن نرى أن ثلاث ملاحظات في مجموعة البيانات أكبر من هذا الخط.
يشير هذا إلى أن هذه الملاحظات يمكن أن يكون لها تأثير كبير على نموذج الانحدار وربما ينبغي فحصها عن كثب قبل تفسير نتائج النموذج.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:
كيفية إنشاء قطعة أرض متبقية في SAS
كيفية إنشاء الرسوم البيانية في SAS
كيفية إنشاء الغيوم النقطية في SAS
كيفية التعرف على القيم المتطرفة في SAS