Как использовать proc surveyselect в sas (с примерами)


Вы можете использовать PROC SURVEYSELECT для выбора случайной выборки из набора данных в SAS.

Вот три распространенных способа использования этой процедуры на практике:

Пример 1. Используйте PROC SURVEYSELECT для выбора простой случайной выборки.

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

В этом конкретном примере из набора данных выбираются 5 случайных наблюдений.

Пример 2. Используйте PROC SURVEYSELECT для выбора стратифицированной случайной выборки.

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

В этом конкретном примере выбираются 2 случайных наблюдения из каждого уникального слоя набора данных.

Оператор Strata указывает переменную, которая будет использоваться для стратификации.

Пример 3. Используйте PROC SURVEYSELECT для выбора объединенной случайной выборки.

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

В этом конкретном примере из набора данных выбираются 2 случайных кластера и включаются все наблюдения из каждого кластера в выборке.

Оператор кластера указывает переменную, которая будет использоваться для кластеризации.

В следующих примерах показано, как использовать каждый метод на практике со следующим набором данных в SAS, содержащим информацию о баскетболистах разных команд:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Пример 1. Используйте PROC SURVEYSELECT для выбора простой случайной выборки.

Мы можем использовать следующий синтаксис, чтобы выбрать простую случайную выборку из 5 наблюдений из набора данных:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

Полученная выборка содержит 5 наблюдений , случайно выбранных из набора данных.

Пример 2. Используйте PROC SURVEYSELECT для выбора стратифицированной случайной выборки.

Мы можем использовать следующий синтаксис для выполнения стратифицированной случайной выборки, в которой из каждой команды случайным образом выбираются 2 наблюдения для включения в выборку:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

Полученная выборка содержит по два случайно выбранных наблюдения от каждой команды.

Связанный: Кластерная выборка и стратифицированная выборка: в чем разница?

Пример 3. Используйте PROC SURVEYSELECT для выбора объединенной случайной выборки.

Мы можем использовать следующий синтаксис для выполнения кластерной случайной выборки, в которой мы используем команды в качестве кластеров, случайным образом выбираем 2 кластера и включаем каждое наблюдение из этих кластеров в выборку:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Эта конкретная выборка содержит все наблюдения команд A и B, которые представляли собой два случайно выбранных «кластера».

Примечание . Полную документацию PROC SURVEYSELECT можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как рассчитать описательную статистику в SAS
Как создать таблицы частот в SAS
Как рассчитать процентили в SAS
Как создавать сводные таблицы в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *