كيفية إزالة التكرارات في sas (مع أمثلة)
يمكنك استخدام فرز proc في SAS لإزالة الصفوف المكررة بسرعة من مجموعة البيانات.
يستخدم هذا الإجراء بناء الجملة الأساسي التالي:
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run;
لاحظ أن الوسيطة by تحدد الأعمدة التي سيتم فحصها عند إزالة التكرارات.
توضح الأمثلة التالية كيفية إزالة التكرارات من مجموعة البيانات التالية في SAS:
/*create dataset*/
data original_data;
input team $position $points;
datalines ;
A Guard 12
A Guard 20
A Guard 20
A Guard 24
A Forward 15
A Forward 15
A Forward 19
A Forward 28
B Guard 10
B Guard 12
B Guard 12
B Guard 26
B Forward 10
B Forward 10
B Forward 10
B Forward 19
;
run ;
/*view dataset*/
proc print data = original_data;
مثال 1: إزالة التكرارات من كافة الأعمدة
يمكننا استخدام الكود التالي لإزالة الصفوف التي تحتوي على قيم مكررة في جميع الأعمدة في مجموعة البيانات:
/*create dataset with no duplicate rows*/
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run ;
/*view dataset with no duplicate rows*/
proc print data =no_dups_data;
لاحظ أنه تمت إزالة إجمالي خمسة صفوف مكررة من مجموعة البيانات الأصلية.
المثال 2: إزالة التكرارات من أعمدة محددة
يمكننا استخدام الوسيطة by لتحديد الأعمدة التي يجب فحصها عند إزالة التكرارات.
على سبيل المثال، يقوم التعليمة البرمجية التالية بإزالة الصفوف ذات القيم المكررة في أعمدة الفريق والموضع :
/*create dataset with no duplicate rows in team and position columns*/
proc sort data =original_data out =no_dups_data nodupkey ;
by team position;
run ;
/*view dataset with no duplicate rows in team and position columns*/
proc print data =no_dups_data;
تبقى أربعة صفوف فقط في مجموعة البيانات بعد إزالة الصفوف ذات القيم المكررة في أعمدة الفريق والموضع .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في SAS:
كيفية تطبيع البيانات في SAS
كيفية التعرف على القيم المتطرفة في SAS
كيفية استخدام ملخص الإجراء في SAS
كيفية إنشاء الجداول التكرارية في SAS