Come utilizzare proc surveyselect in sas (con esempi)
È possibile utilizzare PROC SURVEYSELECT per selezionare un campione casuale da un set di dati in SAS.
Ecco tre modi comuni per utilizzare questa procedura nella pratica:
Esempio 1: utilizzare PROC SURVEYSELECT per selezionare un campione casuale semplice
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
Questo particolare esempio seleziona 5 osservazioni casuali dal set di dati.
Esempio 2: utilizzare PROC SURVEYSELECT per selezionare un campione casuale stratificato
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
Questo particolare esempio seleziona 2 osservazioni casuali da ciascuno strato univoco del set di dati.
L’istruzione strata specifica la variabile da utilizzare per la stratificazione.
Esempio 3: utilizzare PROC SURVEYSELECT per selezionare un campione casuale raggruppato
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
Questo particolare esempio seleziona 2 cluster casuali dal set di dati e include ogni osservazione di ogni cluster nel campione.
L’istruzione cluster specifica la variabile da utilizzare per il clustering.
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente set di dati in SAS che contiene informazioni sui giocatori di basket di diverse squadre:
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
Esempio 1: utilizzare PROC SURVEYSELECT per selezionare un campione casuale semplice
Possiamo utilizzare la seguente sintassi per selezionare un semplice campione casuale di 5 osservazioni dal set di dati:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
Il campione risultante contiene 5 osservazioni scelte casualmente dal set di dati.
Esempio 2: utilizzare PROC SURVEYSELECT per selezionare un campione casuale stratificato
Possiamo utilizzare la seguente sintassi per eseguire un campionamento casuale stratificato in cui 2 osservazioni vengono scelte casualmente da ciascuna squadra per essere incluse nel campione:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
Il campione risultante contiene 2 osservazioni selezionate casualmente da ciascuna squadra.
Correlati: Campionamento a grappolo e campionamento stratificato: qual è la differenza?
Esempio 3: utilizzare PROC SURVEYSELECT per selezionare un campione casuale raggruppato
Possiamo utilizzare la seguente sintassi per eseguire un campionamento casuale in cluster in cui utilizziamo i team come cluster e selezioniamo casualmente 2 cluster e includiamo ciascuna osservazione di questi cluster nel campione:
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
Questo particolare campione contiene tutte le osservazioni delle squadre A e B, che erano i due “cluster” scelti casualmente.
Nota : è possibile trovare la documentazione completa di PROC SURVEYSELECT qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come calcolare le statistiche descrittive in SAS
Come creare tabelle di frequenza in SAS
Come calcolare i percentili in SAS
Come creare tabelle pivot in SAS