Come selezionare un campione casuale in sas: con esempi


Ecco i due modi più comuni per selezionare un semplice campione casuale di righe da un set di dati in SAS:

Metodo 1: selezionare un campione casuale utilizzando la dimensione del campione

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Metodo 2: selezionare un campione casuale utilizzando la proporzione delle osservazioni totali

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

Esempio 1: selezionare un campione casuale utilizzando la dimensione del campione

Il codice seguente mostra come selezionare un campione casuale di osservazioni dal set di dati utilizzando una dimensione del campione pari a n=3:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

Possiamo vedere che tre righe sono state selezionate casualmente dal set di dati originale.

Esempio 2: selezionare un campione casuale utilizzando la proporzione delle osservazioni totali

Il codice seguente mostra come selezionare un campione casuale di osservazioni dal set di dati utilizzando la funzione samprate per specificare che si desidera che il campione casuale rappresenti il 20% di tutte le osservazioni originali:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

Possiamo vedere che il 20% delle osservazioni totali (20% * 10 osservazioni = 2 ) dal set di dati originale è stato selezionato casualmente per far parte del nostro campione.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come rinominare le variabili in SAS
Come creare nuove variabili in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *