Як використовувати proc surveyselect у sas (з прикладами)


Ви можете використовувати PROC SURVEYSELECT , щоб вибрати випадкову вибірку з набору даних у SAS.

Ось три поширені способи використання цієї процедури на практиці:

Приклад 1: використовуйте PROC SURVEYSELECT, щоб вибрати просту випадкову вибірку

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

У цьому прикладі вибрано 5 випадкових спостережень із набору даних.

Приклад 2: використовуйте PROC SURVEYSELECT, щоб вибрати стратифіковану випадкову вибірку

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

У цьому конкретному прикладі вибираються 2 випадкових спостереження з кожного унікального шару набору даних.

Інструкція strata вказує змінну для стратифікації.

Приклад 3: використовуйте PROC SURVEYSELECT, щоб вибрати об’єднану випадкову вибірку

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

У цьому конкретному прикладі вибираються 2 випадкові кластери з набору даних і включається кожне спостереження з кожного кластера у вибірці.

Інструкція cluster вказує змінну для використання в кластеризації.

У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким набором даних у SAS, який містить інформацію про баскетболістів із різних команд:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Приклад 1: використовуйте PROC SURVEYSELECT, щоб вибрати просту випадкову вибірку

Ми можемо використовувати такий синтаксис, щоб вибрати просту випадкову вибірку з 5 спостережень із набору даних:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

Отримана вибірка містить 5 спостережень , випадково вибраних із набору даних.

Приклад 2: використовуйте PROC SURVEYSELECT, щоб вибрати стратифіковану випадкову вибірку

Ми можемо використовувати наступний синтаксис для виконання стратифікованої випадкової вибірки, у якій 2 спостереження випадковим чином вибираються з кожної команди для включення у вибірку:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

Отримана вибірка містить 2 випадково відібраних спостереження від кожної команди.

За темою: Кластерна вибірка та стратифікована вибірка: у чому різниця?

Приклад 3: використовуйте PROC SURVEYSELECT, щоб вибрати об’єднану випадкову вибірку

Ми можемо використовувати наступний синтаксис для виконання кластерної випадкової вибірки, у якій ми використовуємо команди як кластери та випадково вибираємо 2 кластери та включаємо кожне спостереження з цих кластерів у вибірку:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Ця конкретна вибірка містить усі спостереження команд A і B, які були випадково вибраними «кластерами».

Примітка . Ви можете знайти повну документацію PROC SURVEYSELECT тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як розрахувати описову статистику в SAS
Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *