So verwenden sie proc compare in sas (mit beispielen)


Sie können PROC COMPARE in SAS verwenden, um schnell Ähnlichkeiten und Unterschiede zwischen zwei Datensätzen zu erkennen.

Dieses Verfahren verwendet die folgende grundlegende Syntax:

 proc compare
    base =data1
    compare =data2;
run ;

Das folgende Beispiel zeigt, wie Sie dieses Verfahren in der Praxis anwenden können.

Beispiel: Verwendung von Proc Compare in SAS

Nehmen wir an, wir haben die folgenden zwei Datensätze in SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Mit der folgenden PROC COMPARE- Anweisung können wir die Ähnlichkeiten und Unterschiede zwischen den beiden Datensätzen ermitteln:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Dadurch werden in der Ausgabe drei Tabellen erzeugt:

Tabelle 1: Eine Zusammenfassung der beiden Tabellen

Die erste Tabelle enthält eine kurze Zusammenfassung jedes Datensatzes, einschließlich:

1. Die Anzahl der Variablen (NVar) und Beobachtungen (NObs) in jedem Datensatz.

  • Daten1 hat 3 Variablen und 5 Beobachtungen
  • Data2 hat 2 Variablen und 5 Beobachtungen

2. Die Anzahl gemeinsamer Variablen zwischen den beiden Datensätzen.

  • Daten1 und Daten2 haben zwei gemeinsame Variablen (Team und Punkte).

Tabelle 2: Eine Zusammenfassung der Anzahl der Wertunterschiede

Die zweite Tabelle fasst die Anzahl der Werteunterschiede zwischen den beiden Tabellen zusammen.

Der interessanteste Teil dieser Ausgabe befindet sich am Ende der Tabelle, wo wir eine Zusammenfassung der Unterschiede zwischen den Variablen sehen können:

  • Die Teamvariable hat 3 Beobachtungen mit unterschiedlichen Werten.
  • Punktvariablen haben 3 Beobachtungen mit unterschiedlichen Werten. Die maximale Differenz beträgt 9.

Tabelle 3: Tatsächliche Unterschiede zwischen den Beobachtungen

Die dritte Tabelle zeigt die tatsächlichen Unterschiede zwischen den Beobachtungen in den beiden Datensätzen.

Die erste Tabelle zeigt die Teamvariablenunterschiede zwischen den beiden Datensätzen.

  • Beispielsweise hat in Daten1 die dritte Beobachtung einen Wert von C für Team, während in Daten2 die dritte Beobachtung einen Wert von F hat.

Die zweite Tabelle zeigt die Unterschiede in den Punktvariablen zwischen den beiden Datensätzen.

  • Beispielsweise hat in Daten1 die dritte Beobachtung einen Wert von 18 für Punkte, während in Daten2 die dritte Beobachtung einen Wert von 27 hat. Der Unterschied zwischen den beiden Werten beträgt 9 .

Diese drei Tabellen geben uns ein umfassendes Verständnis der Unterschiede zwischen den beiden Datensätzen.

Beachten Sie, dass Sie die folgende Syntax verwenden können, wenn Sie nur die Unterschiede zwischen den beiden Datensätzen für eine bestimmte Variable vergleichen möchten:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Dadurch werden dieselben drei Tabellen wie zuvor erstellt, es wird jedoch nur die Ausgabe der Punktevariablen angezeigt.

Hinweis : Die vollständige PROC COMPARE- Dokumentation finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie die Verfahrenszusammenfassung in SAS
So verwenden Sie Proc Tabulate in SAS
So verwenden Sie die Proc-Sortierung in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert