Как использовать сравнение процедур в sas (с примерами)
Вы можете использовать PROC COMPARE в SAS, чтобы быстро выявить сходства и различия между двумя наборами данных.
В этой процедуре используется следующий базовый синтаксис:
proc compare base =data1 compare =data2; run ;
В следующем примере показано, как использовать эту процедуру на практике.
Пример: использование сравнения процедур в SAS
Предположим, у нас есть следующие два набора данных в SAS:
/*create datasets*/
data data1;
input team $pointsrebounds;
datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;
data data2;
input team $points;
datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;
/*view datasets*/
proc print data =data1;
proc print data =data2;
Мы можем использовать следующий оператор PROC COMPARE , чтобы найти сходства и различия между двумя наборами данных:
/*compare the two datasets*/
proc compare
base =data1
compare =data2;
run ;
В результате вы получите три таблицы:
Таблица 1. Сводная информация по двум таблицам
В первой таблице представлено краткое описание каждого набора данных, включая:
1. Количество переменных (NVar) и наблюдений (NObs) в каждом наборе данных.
- Data1 имеет 3 переменных и 5 наблюдений.
- Data2 имеет 2 переменные и 5 наблюдений.
2. Количество общих переменных между двумя наборами данных.
- Данные1 и Данные2 имеют две общие переменные (команда и очки).
Таблица 2: Сводная информация о количестве различий в значениях
Во второй таблице суммировано количество различий в значениях между двумя таблицами.
Самая интересная часть этих результатов находится в конце таблицы, где мы можем увидеть сводку различий между переменными:
- Переменная команды имеет 3 наблюдения с разными значениями.
- Точечные переменные имеют 3 наблюдения с разными значениями. Максимальная разница 9.
Таблица 3: Фактические различия между наблюдениями
Третья таблица показывает фактические различия между наблюдениями в двух наборах данных.
В первой таблице показаны различия командных переменных между двумя наборами данных.
- Например, в data1 третье наблюдение имеет значение C для команды, а в data2 третье наблюдение имеет значение F.
Во второй таблице показаны различия в точечных переменных между двумя наборами данных.
- Например, в data1 третье наблюдение имеет значение 18 для точек, а в data2 третье наблюдение имеет значение 27 . Разница между двумя значениями равна 9 .
Эти три таблицы дают нам полное понимание различий между двумя наборами данных.
Обратите внимание: если вы хотите сравнить только различия между двумя наборами данных для конкретной переменной, вы можете использовать следующий синтаксис:
/*compare the differences between the datasets only for 'points' variable*/
proc compare
base =data1
compare =data2;
var points;
run ;
В результате будут созданы те же три таблицы, что и раньше, но будут отображаться только выходные данные переменной точек .
Примечание . Полную документацию PROC COMPARE можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как использовать сводку процедур в SAS
Как использовать Proc Tabulate в SAS
Как использовать сортировку Proc в SAS