Как использовать сравнение процедур в sas (с примерами)


Вы можете использовать PROC COMPARE в SAS, чтобы быстро выявить сходства и различия между двумя наборами данных.

В этой процедуре используется следующий базовый синтаксис:

 proc compare
    base =data1
    compare =data2;
run ;

В следующем примере показано, как использовать эту процедуру на практике.

Пример: использование сравнения процедур в SAS

Предположим, у нас есть следующие два набора данных в SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Мы можем использовать следующий оператор PROC COMPARE , чтобы найти сходства и различия между двумя наборами данных:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

В результате вы получите три таблицы:

Таблица 1. Сводная информация по двум таблицам

В первой таблице представлено краткое описание каждого набора данных, включая:

1. Количество переменных (NVar) и наблюдений (NObs) в каждом наборе данных.

  • Data1 имеет 3 переменных и 5 наблюдений.
  • Data2 имеет 2 переменные и 5 наблюдений.

2. Количество общих переменных между двумя наборами данных.

  • Данные1 и Данные2 имеют две общие переменные (команда и очки).

Таблица 2: Сводная информация о количестве различий в значениях

Во второй таблице суммировано количество различий в значениях между двумя таблицами.

Самая интересная часть этих результатов находится в конце таблицы, где мы можем увидеть сводку различий между переменными:

  • Переменная команды имеет 3 наблюдения с разными значениями.
  • Точечные переменные имеют 3 наблюдения с разными значениями. Максимальная разница 9.

Таблица 3: Фактические различия между наблюдениями

Третья таблица показывает фактические различия между наблюдениями в двух наборах данных.

В первой таблице показаны различия командных переменных между двумя наборами данных.

  • Например, в data1 третье наблюдение имеет значение C для команды, а в data2 третье наблюдение имеет значение F.

Во второй таблице показаны различия в точечных переменных между двумя наборами данных.

  • Например, в data1 третье наблюдение имеет значение 18 для точек, а в data2 третье наблюдение имеет значение 27 . Разница между двумя значениями равна 9 .

Эти три таблицы дают нам полное понимание различий между двумя наборами данных.

Обратите внимание: если вы хотите сравнить только различия между двумя наборами данных для конкретной переменной, вы можете использовать следующий синтаксис:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

В результате будут созданы те же три таблицы, что и раньше, но будут отображаться только выходные данные переменной точек .

Примечание . Полную документацию PROC COMPARE можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать сводку процедур в SAS
Как использовать Proc Tabulate в SAS
Как использовать сортировку Proc в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *