Come selezionare un campione casuale in sas: con esempi
Ecco i due modi più comuni per selezionare un semplice campione casuale di righe da un set di dati in SAS:
Metodo 1: selezionare un campione casuale utilizzando la dimensione del campione
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
sampsize =3 /*select 3 observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
Metodo 2: selezionare un campione casuale utilizzando la proporzione delle osservazioni totali
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
samprate =0.2 /*select 20% of all observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;
/*view dataset*/
proc print data = original_data;
Esempio 1: selezionare un campione casuale utilizzando la dimensione del campione
Il codice seguente mostra come selezionare un campione casuale di osservazioni dal set di dati utilizzando una dimensione del campione pari a n=3:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
sampsize =3
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
Possiamo vedere che tre righe sono state selezionate casualmente dal set di dati originale.
Esempio 2: selezionare un campione casuale utilizzando la proporzione delle osservazioni totali
Il codice seguente mostra come selezionare un campione casuale di osservazioni dal set di dati utilizzando la funzione samprate per specificare che si desidera che il campione casuale rappresenti il 20% di tutte le osservazioni originali:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
samprate =0.2
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
Possiamo vedere che il 20% delle osservazioni totali (20% * 10 osservazioni = 2 ) dal set di dati originale è stato selezionato casualmente per far parte del nostro campione.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare il riepilogo della procedura in SAS
Come rinominare le variabili in SAS
Come creare nuove variabili in SAS