كيفية استخدام proc compare في sas (مع أمثلة)


يمكنك استخدام PROC COMPARE في SAS للتعرف بسرعة على أوجه التشابه والاختلاف بين مجموعتي بيانات.

يستخدم هذا الإجراء بناء الجملة الأساسي التالي:

 proc compare
    base =data1
    compare =data2;
run ;

يوضح المثال التالي كيفية استخدام هذا الإجراء عمليًا.

مثال: استخدام Proc Compar في SAS

لنفترض أن لدينا المجموعتين التاليتين من البيانات في SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

يمكننا استخدام عبارة PROC COMPARE التالية للعثور على أوجه التشابه والاختلاف بين مجموعتي البيانات:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

سيؤدي هذا إلى إنتاج ثلاثة جداول في الإخراج:

الجدول 1: ملخص الجدولين

يقدم الجدول الأول ملخصًا مختصرًا لكل مجموعة بيانات، بما في ذلك:

1. عدد المتغيرات (NVar) والملاحظات (NObs) في كل مجموعة بيانات.

  • يحتوي Data1 على 3 متغيرات و5 ملاحظات
  • يحتوي Data2 على متغيرين و5 ملاحظات

2. عدد المتغيرات المشتركة بين مجموعتي البيانات.

  • يحتوي Data1 وData2 على متغيرين مشتركين (الفريق والنقاط)

الجدول 2: ملخص لعدد فروق القيمة

ويلخص الجدول الثاني عدد الاختلافات في القيم بين الجدولين.

الجزء الأكثر إثارة للاهتمام من هذا الناتج هو في نهاية الجدول حيث يمكننا رؤية ملخص للاختلافات بين المتغيرات:

  • يحتوي متغير الفريق على 3 ملاحظات بقيم مختلفة.
  • تحتوي متغيرات النقاط على 3 ملاحظات بقيم مختلفة. الحد الأقصى للفرق هو 9.

الجدول 3: الاختلافات الفعلية بين الملاحظات

يوضح الجدول الثالث الاختلافات الفعلية بين الملاحظات في مجموعتي البيانات.

يوضح الجدول الأول اختلافات متغيرات الفريق بين مجموعتي البيانات.

  • على سبيل المثال، في data1، الملاحظة الثالثة لها قيمة C للفريق بينما في data2، الملاحظة الثالثة لها قيمة F.

ويبين الجدول الثاني الاختلافات في متغيرات النقاط بين مجموعتي البيانات.

  • على سبيل المثال، في data1 الملاحظة الثالثة لها قيمة 18 للنقاط بينما في data2 الملاحظة الثالثة لها قيمة 27 . الفرق بين القيمتين هو 9 .

تمنحنا هذه الجداول الثلاثة فهمًا كاملاً للاختلافات بين مجموعتي البيانات.

لاحظ أنه إذا كنت تريد مقارنة الاختلافات بين مجموعتي البيانات لمتغير معين فقط، فيمكنك استخدام بناء الجملة التالي:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

سيؤدي هذا إلى إنتاج نفس الجداول الثلاثة كما كان من قبل، ولكن سيتم عرض مخرجات متغير النقاط فقط.

ملاحظة : يمكنك العثور على وثائق PROC COMPARE الكاملة هنا .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:

كيفية استخدام ملخص الإجراء في SAS
كيفية استخدام Proc Tabulate في SAS
كيفية استخدام ترتيب Proc في SAS

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *