Sas: как использовать оператор datalines для создания набора данных
Вы можете использовать оператор datalines в SAS, чтобы быстро создать новый набор данных с нуля.
Для этого вы можете использовать следующий базовый синтаксис:
data original_data;
input var1 $var2;
datalines ;
AT 12
B 19
C23
D 40
;
run ;
Вот что делает каждая инструкция:
- данные : имя набора данных.
- input : имя и тип каждой переменной в наборе данных.
- datalines : фактические значения в наборе данных
Обратите внимание, что знак доллара « $ » после имени переменной сообщает SAS, что переменная является символьной.
Следующие примеры показывают, как использовать оператор datalines на практике.
Пример 1. Создайте набор данных со всеми числовыми переменными.
Следующий код показывает, как создать набор данных с тремя числовыми переменными: очками, передачами и подборами:
/*create dataset*/
data original_data;
input points assists rebounds;
datalines ;
22 8 4
29 5 4
31 12 8
30 9 14
22 7 1
24 9 2
18 6 4
20 5 5
25 1 4
;
run ;
/*view dataset*/
proc print data = original_data;
Результатом является набор данных с тремя числовыми переменными.
Пример 2. Создайте набор данных с буквенными и числовыми переменными.
Следующий код показывает, как создать набор данных с буквенными и числовыми переменными:
/*create dataset*/
data original_data;
input team $position $points assists;
datalines ;
A Guard 8 4
A Guard 5 4
A Forward 12 8
A Forward 9 14
A Forward 7 1
B Guard 9 2
B Guard 14 9
B Forward 15 8
B Forward 11 4
;
run ;
/*view dataset*/
proc print data = original_data;
Мы можем использовать функцию содержимого proc , чтобы проверить тип каждой переменной:
proc contents data =original_data;
Из результата мы видим, что команда и позиция являются переменными персонажа, а очки и передачи — числовыми переменными.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как создать новые переменные в SAS
Как заменить символы в строке в SAS
Как заменить пропущенные значения нулями в SAS
Как удалить дубликаты в SAS