Hoe u een willekeurig monster in sas selecteert: met voorbeelden


Dit zijn de twee meest voorkomende manieren om een eenvoudige willekeurige steekproef van rijen uit een gegevensset in SAS te selecteren:

Methode 1: Selecteer een willekeurige steekproef met behulp van de steekproefgrootte

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Methode 2: Selecteer een willekeurige steekproef op basis van het aandeel van de totale waarnemingen

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

Voorbeeld 1: Selecteer een willekeurige steekproef met behulp van de steekproefgrootte

De volgende code laat zien hoe u een willekeurige steekproef van waarnemingen uit de dataset selecteert met een steekproefomvang van n=3:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

We kunnen zien dat drie rijen willekeurig zijn geselecteerd uit de oorspronkelijke dataset.

Voorbeeld 2: Selecteer een willekeurige steekproef op basis van het aandeel van de totale waarnemingen

De volgende code laat zien hoe u een willekeurige steekproef van waarnemingen uit de dataset selecteert met behulp van de samprate- functie om aan te geven dat we willen dat de willekeurige steekproef 20% van alle oorspronkelijke waarnemingen vertegenwoordigt:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

We kunnen zien dat 20% van het totale aantal waarnemingen (20% * 10 waarnemingen = 2 ) uit de oorspronkelijke dataset willekeurig werd geselecteerd om deel uit te maken van onze steekproef.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Procedureoverzicht gebruiken in SAS
Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert