Hoe de data-stap in sas te gebruiken (met voorbeelden)
U kunt de stap DATA in SAS gebruiken om gegevenssets te maken.
Er zijn twee veelgebruikte manieren om de DATA- stap te gebruiken:
1. Maak een geheel nieuwe dataset.
2. Maak een dataset van een bestaande dataset.
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.
Voorbeeld 1: Gebruik de DATA-stap om een geheel nieuwe dataset te maken
De volgende syntaxis laat zien hoe u de stap DATA gebruikt om een gegevensset met drie variabelen te maken:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 25
A Guard 20
A Guard 30
A Forward 25
A Forward 10
B Guard 10
B Guard 22
B Forward 30
B Forward 10
B Forward 10
B Forward 25
;
run ;
/*view dataset*/
proc print data =my_data;
Dit is precies wat we in dit voorbeeld hebben gedaan:
Eerst hebben we data gebruikt om de dataset een naam te geven.
Vervolgens gebruikten we invoer om de namen van de variabelen op te geven ( $ specificeert een tekenvariabele).
Vervolgens gebruikten we gegevensrijen om SAS te vertellen dat de komende rijen waarden in de dataset vertegenwoordigden.
Voorbeeld 2: Gebruik de DATA-stap om een dataset te maken op basis van een bestaande dataset
We kunnen de datastap met de set- instructie gebruiken om een dataset te maken op basis van een andere dataset die al bestaat.
We kunnen bijvoorbeeld de volgende syntaxis gebruiken om een nieuwe gegevensset te maken met de naam new_data , die de variabelen uit de gegevensset met de naam my_data gebruikt, maar de variabele „returns“ verwijdert:
/*create new dataset that drops returns from my_data*/
data new_data;
set my_data;
drop returns;
run ;
/*view dataset*/
proc print data = new_data;
Dit is precies wat we in dit voorbeeld hebben gedaan:
Eerst hebben we gegevens gebruikt om de nieuwe gegevensset een naam te geven.
Vervolgens hebben we set gebruikt om de bestaande gegevensset op te geven waaruit de nieuwe gegevensset moet worden gemaakt.
Vervolgens hebben we drop gebruikt om de variabele ‘return’ uit de nieuwe dataset te verwijderen.
Het eindresultaat is een nieuwe dataset die exact dezelfde variabelen bevat als de originele dataset, behalve dat de variabele „returns“ is verwijderd.
Gerelateerd: KEEP- en DROP-instructies gebruiken in SAS
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Procedureoverzicht gebruiken in SAS
Proc-tabel gebruiken in SAS
Proc-collatie gebruiken in SAS