Як вибрати випадкову вибірку в sas: із прикладами
Ось два найпоширеніші способи вибору простої випадкової вибірки рядків із набору даних у SAS:
Спосіб 1: Виберіть випадкову вибірку за допомогою розміру вибірки
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
sampsize =3 /*select 3 observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
Метод 2: Виберіть випадкову вибірку, використовуючи пропорцію від загальної кількості спостережень
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
samprate =0.2 /*select 20% of all observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
У наведених нижче прикладах показано, як використовувати кожен метод із таким набором даних у SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;
/*view dataset*/
proc print data = original_data;
Приклад 1: вибір випадкової вибірки за допомогою розміру вибірки
Наступний код показує, як вибрати випадкову вибірку спостережень із набору даних, використовуючи розмір вибірки n=3:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
sampsize =3
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
Ми бачимо, що три рядки були випадковим чином вибрані з вихідного набору даних.
Приклад 2: Виберіть випадкову вибірку, використовуючи частку загальної кількості спостережень
Наступний код показує, як вибрати випадкову вибірку спостережень із набору даних за допомогою функції samprate , щоб вказати, що ми хочемо, щоб випадкова вибірка представляла 20% усіх вихідних спостережень:
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
samprate =0.2
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
Ми бачимо, що 20% від загальної кількості спостережень (20% * 10 спостережень = 2 ) з початкового набору даних були випадковим чином відібрані для нашої вибірки.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати зведення процедур у SAS
Як перейменувати змінні в SAS
Як створити нові змінні в SAS