Proc compare gebruiken in sas (met voorbeelden)


U kunt PROC COMPARE in SAS gebruiken om snel overeenkomsten en verschillen tussen twee datasets te identificeren.

Deze procedure gebruikt de volgende basissyntaxis:

 proc compare
    base =data1
    compare =data2;
run ;

Het volgende voorbeeld laat zien hoe u deze procedure in de praktijk kunt gebruiken.

Voorbeeld: Proc Compare gebruiken in SAS

Laten we aannemen dat we de volgende twee sets gegevens in SAS hebben:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

We kunnen de volgende PROC COMPARE- instructie gebruiken om de overeenkomsten en verschillen tussen de twee datasets te vinden:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Dit levert drie tabellen op in de uitvoer:

Tabel 1: Een samenvatting van de twee tabellen

De eerste tabel geeft een korte samenvatting van elke dataset, inclusief:

1. Het aantal variabelen (NVar) en observaties (NObs) in elke dataset.

  • Data1 heeft 3 variabelen en 5 observaties
  • Data2 heeft 2 variabelen en 5 observaties

2. Het aantal gemeenschappelijke variabelen tussen de twee datasets.

  • Data1 en Data2 hebben 2 variabelen gemeen (team en punten)

Tabel 2: Een overzicht van het aantal waardeverschillen

De tweede tabel vat het aantal verschillen in waarden tussen de twee tabellen samen.

Het interessantste deel van deze uitvoer staat aan het einde van de tabel, waar we een samenvatting kunnen zien van de verschillen tussen de variabelen:

  • De teamvariabele heeft 3 observaties met verschillende waarden.
  • Puntvariabelen hebben 3 waarnemingen met verschillende waarden. Het maximale verschil is 9.

Tabel 3: Feitelijke verschillen tussen observaties

De derde tabel toont de werkelijke verschillen tussen waarnemingen in de twee datasets.

De eerste tabel toont de verschillen tussen de teamvariabelen tussen de twee datasets.

  • In data1 heeft de derde observatie bijvoorbeeld de waarde C voor team, terwijl in data2 de derde observatie de waarde F heeft.

De tweede tabel toont de verschillen in puntvariabelen tussen de twee datasets.

  • In data1 heeft de derde observatie bijvoorbeeld een waarde van 18 voor punten, terwijl in data2 de derde observatie een waarde van 27 heeft. Het verschil tussen de twee waarden is 9 .

Deze drie tabellen geven ons een volledig inzicht in de verschillen tussen de twee datasets.

Houd er rekening mee dat als u alleen de verschillen tussen de twee gegevenssets voor een specifieke variabele wilt vergelijken, u de volgende syntaxis kunt gebruiken:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Dit levert dezelfde drie tabellen op als voorheen, maar alleen de uitvoer van de puntenvariabele wordt weergegeven.

Let op : U kunt de volledige PROC COMPARE- documentatie hier vinden.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Procedureoverzicht gebruiken in SAS
Proc-tabel gebruiken in SAS
Proc-collatie gebruiken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert