Як підмножити дані в sas (3 приклади)


Ось три найпоширеніші способи створення піднабору даних у SAS:

Спосіб 1. Виберіть, які стовпці зберегти

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Спосіб 2. Виберіть, які стовпці видалити

 data new_data;
    set original_data;
    dropvar4 ;
run ;

Спосіб 3: Виберіть, які рядки зберегти на основі умови

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

У наведених нижче прикладах показано, як використовувати кожен метод із таким набором даних у SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Приклад 1: виберіть, які стовпці зберегти

Наступний код показує, як створити піднабір даних за допомогою оператора KEEP , щоб зберегти лише певні стовпці:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

Приклад 2: виберіть стовпці для видалення

У наведеному нижче коді показано, як створити підмножину набору даних за допомогою оператора DROP , щоб видалити певні стовпці:

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

Приклад 3: Виберіть, які рядки зберегти на основі умови

У наведеному нижче коді показано, як створити підмножину набору даних за допомогою оператора DELETE , щоб видалити певні рядки з набору даних, значення яких у стовпці точки менше 25:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

Ви також можете використовувати АБО| ”, щоб видалити лінії, де кількість очок менше 25 або кількість підбирань менше 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Ви також можете використовувати оператор AND& “, щоб видалити рядки, де балів менше 25 , а відскоків менше 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як перейменувати змінні в SAS
Як створити нові змінні в SAS
Як замінити символи в рядку в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *