Як вибрати випадкову вибірку в sas: із прикладами


Ось два найпоширеніші способи вибору простої випадкової вибірки рядків із набору даних у SAS:

Спосіб 1: Виберіть випадкову вибірку за допомогою розміру вибірки

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Метод 2: Виберіть випадкову вибірку, використовуючи пропорцію від загальної кількості спостережень

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

У наведених нижче прикладах показано, як використовувати кожен метод із таким набором даних у SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

Приклад 1: вибір випадкової вибірки за допомогою розміру вибірки

Наступний код показує, як вибрати випадкову вибірку спостережень із набору даних, використовуючи розмір вибірки n=3:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

Ми бачимо, що три рядки були випадковим чином вибрані з вихідного набору даних.

Приклад 2: Виберіть випадкову вибірку, використовуючи частку загальної кількості спостережень

Наступний код показує, як вибрати випадкову вибірку спостережень із набору даних за допомогою функції samprate , щоб вказати, що ми хочемо, щоб випадкова вибірка представляла 20% усіх вихідних спостережень:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

Ми бачимо, що 20% від загальної кількості спостережень (20% * 10 спостережень = 2 ) з початкового набору даних були випадковим чином відібрані для нашої вибірки.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати зведення процедур у SAS
Як перейменувати змінні в SAS
Як створити нові змінні в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *