Come utilizzare proc surveyselect in sas (con esempi)


È possibile utilizzare PROC SURVEYSELECT per selezionare un campione casuale da un set di dati in SAS.

Ecco tre modi comuni per utilizzare questa procedura nella pratica:

Esempio 1: utilizzare PROC SURVEYSELECT per selezionare un campione casuale semplice

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

Questo particolare esempio seleziona 5 osservazioni casuali dal set di dati.

Esempio 2: utilizzare PROC SURVEYSELECT per selezionare un campione casuale stratificato

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

Questo particolare esempio seleziona 2 osservazioni casuali da ciascuno strato univoco del set di dati.

L’istruzione strata specifica la variabile da utilizzare per la stratificazione.

Esempio 3: utilizzare PROC SURVEYSELECT per selezionare un campione casuale raggruppato

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

Questo particolare esempio seleziona 2 cluster casuali dal set di dati e include ogni osservazione di ogni cluster nel campione.

L’istruzione cluster specifica la variabile da utilizzare per il clustering.

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente set di dati in SAS che contiene informazioni sui giocatori di basket di diverse squadre:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Esempio 1: utilizzare PROC SURVEYSELECT per selezionare un campione casuale semplice

Possiamo utilizzare la seguente sintassi per selezionare un semplice campione casuale di 5 osservazioni dal set di dati:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

Il campione risultante contiene 5 osservazioni scelte casualmente dal set di dati.

Esempio 2: utilizzare PROC SURVEYSELECT per selezionare un campione casuale stratificato

Possiamo utilizzare la seguente sintassi per eseguire un campionamento casuale stratificato in cui 2 osservazioni vengono scelte casualmente da ciascuna squadra per essere incluse nel campione:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

Il campione risultante contiene 2 osservazioni selezionate casualmente da ciascuna squadra.

Correlati: Campionamento a grappolo e campionamento stratificato: qual è la differenza?

Esempio 3: utilizzare PROC SURVEYSELECT per selezionare un campione casuale raggruppato

Possiamo utilizzare la seguente sintassi per eseguire un campionamento casuale in cluster in cui utilizziamo i team come cluster e selezioniamo casualmente 2 cluster e includiamo ciascuna osservazione di questi cluster nel campione:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Questo particolare campione contiene tutte le osservazioni delle squadre A e B, che erano i due “cluster” scelti casualmente.

Nota : è possibile trovare la documentazione completa di PROC SURVEYSELECT qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come calcolare le statistiche descrittive in SAS
Come creare tabelle di frequenza in SAS
Come calcolare i percentili in SAS
Come creare tabelle pivot in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *