Hoe u een willekeurig monster in sas selecteert: met voorbeelden
Dit zijn de twee meest voorkomende manieren om een eenvoudige willekeurige steekproef van rijen uit een gegevensset in SAS te selecteren:
Methode 1: Selecteer een willekeurige steekproef met behulp van de steekproefgrootte
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
sampsize =3 /*select 3 observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
Methode 2: Selecteer een willekeurige steekproef op basis van het aandeel van de totale waarnemingen
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
samprate =0.2 /*select 20% of all observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;
/*view dataset*/
proc print data = original_data;
Voorbeeld 1: Selecteer een willekeurige steekproef met behulp van de steekproefgrootte
De volgende code laat zien hoe u een willekeurige steekproef van waarnemingen uit de dataset selecteert met een steekproefomvang van n=3:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
sampsize =3
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
We kunnen zien dat drie rijen willekeurig zijn geselecteerd uit de oorspronkelijke dataset.
Voorbeeld 2: Selecteer een willekeurige steekproef op basis van het aandeel van de totale waarnemingen
De volgende code laat zien hoe u een willekeurige steekproef van waarnemingen uit de dataset selecteert met behulp van de samprate- functie om aan te geven dat we willen dat de willekeurige steekproef 20% van alle oorspronkelijke waarnemingen vertegenwoordigt:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
samprate =0.2
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
We kunnen zien dat 20% van het totale aantal waarnemingen (20% * 10 waarnemingen = 2 ) uit de oorspronkelijke dataset willekeurig werd geselecteerd om deel uit te maken van onze steekproef.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Procedureoverzicht gebruiken in SAS
Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS