Como usar proc surveyselect em sas (com exemplos)


Você pode usar PROC SURVEYSELECT para selecionar uma amostra aleatória de um conjunto de dados no SAS.

Aqui estão três maneiras comuns de usar esse procedimento na prática:

Exemplo 1: Use PROC SURVEYSELECT para selecionar uma amostra aleatória simples

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

Este exemplo específico seleciona 5 observações aleatórias do conjunto de dados.

Exemplo 2: Use PROC SURVEYSELECT para selecionar uma amostra aleatória estratificada

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

Este exemplo específico seleciona 2 observações aleatórias de cada estrato único do conjunto de dados.

A instrução strata especifica a variável a ser usada para estratificação.

Exemplo 3: Use PROC SURVEYSELECT para selecionar uma amostra aleatória agrupada

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

Este exemplo específico seleciona 2 clusters aleatórios do conjunto de dados e inclui todas as observações de cada cluster na amostra.

A instrução cluster especifica a variável a ser usada para clustering.

Os exemplos a seguir mostram como usar cada método na prática com o seguinte conjunto de dados no SAS que contém informações sobre jogadores de basquete de diferentes times:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Exemplo 1: Use PROC SURVEYSELECT para selecionar uma amostra aleatória simples

Podemos usar a seguinte sintaxe para selecionar uma amostra aleatória simples de 5 observações do conjunto de dados:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

A amostra resultante contém 5 observações escolhidas aleatoriamente do conjunto de dados.

Exemplo 2: Use PROC SURVEYSELECT para selecionar uma amostra aleatória estratificada

Podemos usar a seguinte sintaxe para realizar uma amostragem aleatória estratificada na qual 2 observações são escolhidas aleatoriamente de cada equipe para serem incluídas na amostra:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

A amostra resultante contém 2 observações selecionadas aleatoriamente de cada equipe.

Relacionado: Amostragem por Cluster e Amostragem Estratificada: Qual é a diferença?

Exemplo 3: Use PROC SURVEYSELECT para selecionar uma amostra aleatória agrupada

Podemos usar a seguinte sintaxe para realizar amostragem aleatória agrupada, na qual usamos equipes como agrupamentos e selecionamos aleatoriamente 2 agrupamentos e incluímos cada observação desses agrupamentos na amostra:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Esta amostra específica contém todas as observações das equipes A e B, que foram os dois “clusters” escolhidos aleatoriamente.

Nota : Você pode encontrar a documentação completa do PROC SURVEYSELECT aqui .

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como calcular estatísticas descritivas no SAS
Como criar tabelas de frequência no SAS
Como calcular percentis no SAS
Como criar tabelas dinâmicas no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *