Como usar proc compare em sas (com exemplos)


Você pode usar PROC COMPARE no SAS para identificar rapidamente semelhanças e diferenças entre dois conjuntos de dados.

Este procedimento usa a seguinte sintaxe básica:

 proc compare
    base =data1
    compare =data2;
run ;

O exemplo a seguir mostra como usar esse procedimento na prática.

Exemplo: usando Proc Compare no SAS

Vamos supor que temos os dois conjuntos de dados a seguir no SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Podemos usar a seguinte instrução PROC COMPARE para encontrar as semelhanças e diferenças entre os dois conjuntos de dados:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Isso produzirá três tabelas na saída:

Tabela 1: Um resumo das duas tabelas

A primeira tabela fornece um breve resumo de cada conjunto de dados, incluindo:

1. O número de variáveis (NVar) e observações (NObs) em cada conjunto de dados.

  • Data1 tem 3 variáveis e 5 observações
  • Data2 tem 2 variáveis e 5 observações

2. O número de variáveis comuns entre os dois conjuntos de dados.

  • Data1 e Data2 possuem 2 variáveis em comum (equipe e pontos)

Tabela 2: Um resumo do número de diferenças de valor

A segunda tabela resume o número de diferenças de valores entre as duas tabelas.

A parte mais interessante deste resultado está no final da tabela onde podemos ver um resumo das diferenças entre as variáveis:

  • A variável equipe possui 3 observações com valores diferentes.
  • Variáveis pontuais possuem 3 observações com valores diferentes. A diferença máxima é 9.

Tabela 3: Diferenças reais entre observações

A terceira tabela mostra as diferenças reais entre as observações nos dois conjuntos de dados.

A primeira tabela mostra as diferenças das variáveis da equipe entre os dois conjuntos de dados.

  • Por exemplo, nos dados1, a terceira observação tem um valor C para a equipe, enquanto nos dados2, a terceira observação tem um valor F.

A segunda tabela mostra as diferenças nas variáveis pontuais entre os dois conjuntos de dados.

  • Por exemplo, em data1 a terceira observação tem um valor de 18 para pontos enquanto em data2 a terceira observação tem um valor de 27 . A diferença entre os dois valores é 9 .

Essas três tabelas nos dão uma compreensão completa das diferenças entre os dois conjuntos de dados.

Observe que se quiser comparar apenas as diferenças entre os dois conjuntos de dados para uma variável específica, você pode usar a seguinte sintaxe:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Isso produzirá as mesmas três tabelas de antes, mas apenas a saída da variável points será exibida.

Nota : Você pode encontrar a documentação completa do PROC COMPARE aqui .

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como usar o agrupamento Proc no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *