Como selecionar uma amostra aleatória no sas: com exemplos


Aqui estão as duas maneiras mais comuns de selecionar uma amostra aleatória simples de linhas de um conjunto de dados no SAS:

Método 1: Selecione uma amostra aleatória usando o tamanho da amostra

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Método 2: Selecione uma amostra aleatória usando a proporção do total de observações

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

Exemplo 1: Selecione uma amostra aleatória usando o tamanho da amostra

O código a seguir mostra como selecionar uma amostra aleatória de observações do conjunto de dados usando um tamanho de amostra de n=3:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

Podemos ver que três linhas foram selecionadas aleatoriamente do conjunto de dados original.

Exemplo 2: Selecione uma amostra aleatória usando a proporção do total de observações

O código a seguir mostra como selecionar uma amostra aleatória de observações do conjunto de dados usando a função samprate para especificar que queremos que a amostra aleatória represente 20% de todas as observações originais:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

Podemos ver que 20% do total de observações (20% * 10 observações = 2 ) do conjunto de dados original foram selecionados aleatoriamente para fazer parte de nossa amostra.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como renomear variáveis no SAS
Como criar novas variáveis no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *