Як використовувати proc surveyselect у sas (з прикладами)
Ви можете використовувати PROC SURVEYSELECT , щоб вибрати випадкову вибірку з набору даних у SAS.
Ось три поширені способи використання цієї процедури на практиці:
Приклад 1: використовуйте PROC SURVEYSELECT, щоб вибрати просту випадкову вибірку
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
У цьому прикладі вибрано 5 випадкових спостережень із набору даних.
Приклад 2: використовуйте PROC SURVEYSELECT, щоб вибрати стратифіковану випадкову вибірку
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
У цьому конкретному прикладі вибираються 2 випадкових спостереження з кожного унікального шару набору даних.
Інструкція strata вказує змінну для стратифікації.
Приклад 3: використовуйте PROC SURVEYSELECT, щоб вибрати об’єднану випадкову вибірку
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
У цьому конкретному прикладі вибираються 2 випадкові кластери з набору даних і включається кожне спостереження з кожного кластера у вибірці.
Інструкція cluster вказує змінну для використання в кластеризації.
У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким набором даних у SAS, який містить інформацію про баскетболістів із різних команд:
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
Приклад 1: використовуйте PROC SURVEYSELECT, щоб вибрати просту випадкову вибірку
Ми можемо використовувати такий синтаксис, щоб вибрати просту випадкову вибірку з 5 спостережень із набору даних:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
Отримана вибірка містить 5 спостережень , випадково вибраних із набору даних.
Приклад 2: використовуйте PROC SURVEYSELECT, щоб вибрати стратифіковану випадкову вибірку
Ми можемо використовувати наступний синтаксис для виконання стратифікованої випадкової вибірки, у якій 2 спостереження випадковим чином вибираються з кожної команди для включення у вибірку:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
Отримана вибірка містить 2 випадково відібраних спостереження від кожної команди.
За темою: Кластерна вибірка та стратифікована вибірка: у чому різниця?
Приклад 3: використовуйте PROC SURVEYSELECT, щоб вибрати об’єднану випадкову вибірку
Ми можемо використовувати наступний синтаксис для виконання кластерної випадкової вибірки, у якій ми використовуємо команди як кластери та випадково вибираємо 2 кластери та включаємо кожне спостереження з цих кластерів у вибірку:
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
Ця конкретна вибірка містить усі спостереження команд A і B, які були випадково вибраними «кластерами».
Примітка . Ви можете знайти повну документацію PROC SURVEYSELECT тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як розрахувати описову статистику в SAS
Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS