Come utilizzare proc compare in sas (con esempi)


È possibile utilizzare PROC COMPARE in SAS per identificare rapidamente somiglianze e differenze tra due set di dati.

Questa procedura utilizza la seguente sintassi di base:

 proc compare
    base =data1
    compare =data2;
run ;

L’esempio seguente mostra come utilizzare questa procedura nella pratica.

Esempio: utilizzo di Proc Compare in SAS

Supponiamo di avere i seguenti due set di dati in SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Possiamo utilizzare la seguente istruzione PROC COMPARE per trovare le somiglianze e le differenze tra i due set di dati:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Ciò produrrà tre tabelle nell’output:

Tabella 1: riepilogo delle due tabelle

La prima tabella fornisce un breve riepilogo di ciascun set di dati, tra cui:

1. Il numero di variabili (NVar) e osservazioni (NObs) in ciascun set di dati.

  • Data1 ha 3 variabili e 5 osservazioni
  • Data2 ha 2 variabili e 5 osservazioni

2. Il numero di variabili comuni tra i due set di dati.

  • Dati1 e Dati2 hanno 2 variabili in comune (squadra e punti)

Tabella 2: riepilogo del numero di differenze di valore

La seconda tabella riassume il numero di differenze di valori tra le due tabelle.

La parte più interessante di questo output è alla fine della tabella dove possiamo vedere un riepilogo delle differenze tra le variabili:

  • La variabile squadra ha 3 osservazioni con valori diversi.
  • Le variabili puntuali hanno 3 osservazioni con valori diversi. La differenza massima è 9.

Tabella 3: Differenze effettive tra le osservazioni

La terza tabella mostra le differenze effettive tra le osservazioni nei due set di dati.

La prima tabella mostra le differenze delle variabili del team tra i due set di dati.

  • Ad esempio, in dati1, la terza osservazione ha un valore C per la squadra mentre in dati2, la terza osservazione ha un valore F.

La seconda tabella mostra le differenze nelle variabili punto tra i due set di dati.

  • Ad esempio, in data1 la terza osservazione ha un valore di 18 per punti mentre in data2 la terza osservazione ha un valore di 27 . La differenza tra i due valori è 9 .

Queste tre tabelle ci danno una comprensione completa delle differenze tra i due set di dati.

Tieni presente che se desideri confrontare solo le differenze tra i due set di dati per una variabile specifica, puoi utilizzare la seguente sintassi:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Ciò produrrà le stesse tre tabelle di prima, ma verrà visualizzato solo l’output della variabile points .

Nota : è possibile trovare la documentazione completa di PROC COMPARE qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come utilizzare Proc Tabulate in SAS
Come utilizzare le regole di confronto Proc in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *