Як використовувати proc compare у sas (з прикладами)


Ви можете використовувати PROC COMPARE у SAS, щоб швидко визначити подібності та відмінності між двома наборами даних.

Ця процедура використовує такий базовий синтаксис:

 proc compare
    base =data1
    compare =data2;
run ;

У наступному прикладі показано, як використовувати цю процедуру на практиці.

Приклад: використання Proc Compare у SAS

Припустімо, що в SAS є такі два набори даних:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Ми можемо використати наступний оператор PROC COMPARE , щоб знайти подібності та відмінності між двома наборами даних:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Це створить три таблиці на виході:

Таблиця 1: підсумок двох таблиць

У першій таблиці подано короткий опис кожного набору даних, зокрема:

1. Кількість змінних (NVar) і спостережень (NObs) у кожному наборі даних.

  • Data1 містить 3 змінні та 5 спостережень
  • Data2 має 2 змінні та 5 спостережень

2. Кількість загальних змінних між двома наборами даних.

  • Data1 і Data2 мають 2 спільні змінні (команда та бали)

Таблиця 2: Підсумок кількості відмінностей цінностей

Друга таблиця підсумовує кількість відмінностей у значеннях між двома таблицями.

Найцікавіша частина цього результату знаходиться в кінці таблиці, де ми можемо побачити підсумок відмінностей між змінними:

  • Командна змінна має 3 спостереження з різними значеннями.
  • Точкові змінні мають 3 спостереження з різними значеннями. Максимальна різниця 9.

Таблиця 3: Фактичні відмінності між спостереженнями

Третя таблиця показує фактичні відмінності між спостереженнями в двох наборах даних.

У першій таблиці показано відмінності командних змінних між двома наборами даних.

  • Наприклад, у data1 третє спостереження має значення C для team, тоді як у data2 третє спостереження має значення F.

Друга таблиця показує різницю в точкових змінних між двома наборами даних.

  • Наприклад, у data1 третє спостереження має значення 18 для точок, тоді як у data2 третє спостереження має значення 27 . Різниця між двома значеннями дорівнює 9 .

Ці три таблиці дають нам повне розуміння відмінностей між двома наборами даних.

Зауважте, що якщо ви хочете порівняти лише відмінності між двома наборами даних для певної змінної, ви можете використовувати такий синтаксис:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Це створить ті самі три таблиці, що й раніше, але буде відображено лише результат змінної points .

Примітка . Ви можете знайти повну документацію PROC COMPARE тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати зведення процедур у SAS
Як використовувати Proc Tabulate у SAS
Як використовувати зіставлення Proc у SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *