Proc surveyselect gebruiken in sas (met voorbeelden)


Met PROC SURVEYSELECT kunt u een willekeurige steekproef uit een dataset in SAS selecteren.

Hier zijn drie veelvoorkomende manieren om deze procedure in de praktijk te gebruiken:

Voorbeeld 1: Gebruik PROC SURVEYSELECT om een eenvoudige willekeurige steekproef te selecteren

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

In dit specifieke voorbeeld worden 5 willekeurige waarnemingen uit de dataset geselecteerd.

Voorbeeld 2: Gebruik PROC SURVEYSELECT om een gestratificeerde willekeurige steekproef te selecteren

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

In dit specifieke voorbeeld worden twee willekeurige waarnemingen geselecteerd uit elk uniek stratum van de dataset.

De strata- instructie specificeert de variabele die voor stratificatie moet worden gebruikt.

Voorbeeld 3: Gebruik PROC SURVEYSELECT om een samengevoegde willekeurige steekproef te selecteren

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

In dit specifieke voorbeeld worden twee willekeurige clusters uit de dataset geselecteerd en wordt elke waarneming van elk cluster in de steekproef opgenomen.

De clusterinstructie specificeert de variabele die moet worden gebruikt voor clustering.

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende gegevensset in SAS die informatie bevat over basketbalspelers van verschillende teams:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Voorbeeld 1: Gebruik PROC SURVEYSELECT om een eenvoudige willekeurige steekproef te selecteren

We kunnen de volgende syntaxis gebruiken om een eenvoudige willekeurige steekproef van vijf observaties uit de dataset te selecteren:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

Het resulterende monster bevat vijf willekeurig gekozen waarnemingen uit de dataset.

Voorbeeld 2: Gebruik PROC SURVEYSELECT om een gestratificeerde willekeurige steekproef te selecteren

We kunnen de volgende syntaxis gebruiken om gestratificeerde willekeurige steekproeven uit te voeren, waarbij uit elk team willekeurig twee waarnemingen worden gekozen om in de steekproef te worden opgenomen:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

Het resulterende monster bevat 2 willekeurig geselecteerde observaties van elk team.

Gerelateerd: Clusterbemonstering en gestratificeerde bemonstering: wat is het verschil?

Voorbeeld 3: Gebruik PROC SURVEYSELECT om een samengevoegde willekeurige steekproef te selecteren

We kunnen de volgende syntaxis gebruiken om geclusterde willekeurige steekproeven uit te voeren, waarbij we teams als clusters gebruiken en willekeurig twee clusters selecteren en elke observatie uit deze clusters in de steekproef opnemen:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Deze specifieke steekproef bevat alle waarnemingen van teams A en B, de twee willekeurig gekozen ‘clusters’.

Let op : U kunt de volledige PROC SURVEYSELECT- documentatie hier vinden.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Hoe beschrijvende statistieken in SAS te berekenen
Hoe frequentietabellen in SAS te maken
Hoe percentielen in SAS te berekenen
Draaitabellen maken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert