Як підмножити дані в sas (3 приклади)
Ось три найпоширеніші способи створення піднабору даних у SAS:
Спосіб 1. Виберіть, які стовпці зберегти
data new_data;
set original_data;
keep var1 var3;
run ;
Спосіб 2. Виберіть, які стовпці видалити
data new_data;
set original_data;
dropvar4 ;
run ;
Спосіб 3: Виберіть, які рядки зберегти на основі умови
data new_data;
set original_data;
if var1 < 25 then delete;
run ;
У наведених нижче прикладах показано, як використовувати кожен метод із таким набором даних у SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Приклад 1: виберіть, які стовпці зберегти
Наступний код показує, як створити піднабір даних за допомогою оператора KEEP , щоб зберегти лише певні стовпці:
/*create new dataset*/
data new_data;
set original_data;
keep team points;
run ;
/*view new dataset*/
proc print data = new_data;
Приклад 2: виберіть стовпці для видалення
У наведеному нижче коді показано, як створити підмножину набору даних за допомогою оператора DROP , щоб видалити певні стовпці:
/*create new dataset*/
data new_data;
set original_data;
drop points;
run ;
/*view new dataset*/
proc print data = new_data;
Приклад 3: Виберіть, які рядки зберегти на основі умови
У наведеному нижче коді показано, як створити підмножину набору даних за допомогою оператора DELETE , щоб видалити певні рядки з набору даних, значення яких у стовпці точки менше 25:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Ви також можете використовувати АБО “ | ”, щоб видалити лінії, де кількість очок менше 25 або кількість підбирань менше 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 | rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Ви також можете використовувати оператор AND ” & “, щоб видалити рядки, де балів менше 25 , а відскоків менше 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 & rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як перейменувати змінні в SAS
Як створити нові змінні в SAS
Як замінити символи в рядку в SAS