Sas:如何使用datalines语句创建数据集


您可以使用 SAS 中的datalines语句从头开始快速创建新的数据集。

为此,您可以使用以下基本语法:

 data original_data;
    input var1 $var2;
    datalines ;
AT 12
B 19
C23
D 40
;
run ;

以下是每条指令的作用:

  • data :数据集的名称
  • input :数据集中每个变量的名称和类型
  • datalines :数据集中的实际值

请注意,变量名称后面的美元符号“ $ ”告诉 SAS 该变量是字符变量。

以下示例展示了如何在实践中使用datalines语句。

示例 1:创建包含所有数值变量的数据集

以下代码展示了如何创建包含三个数值变量的数据集:得分、助攻和篮板:

 /*create dataset*/
data original_data;
    input points assists rebounds;
    datalines ;
22 8 4
29 5 4
31 12 8
30 9 14
22 7 1
24 9 2
18 6 4
20 5 5
25 1 4
;
run ;

/*view dataset*/
proc print data = original_data; 

结果是包含三个数值变量的数据集。

示例 2:创建包含字母和数字变量的数据集

以下代码显示如何创建包含字母和数字变量的数据集:

 /*create dataset*/
data original_data;
    input team $position $points assists;
    datalines ;
A Guard 8 4
A Guard 5 4
A Forward 12 8
A Forward 9 14
A Forward 7 1
B Guard 9 2
B Guard 14 9
B Forward 15 8
B Forward 11 4
;
run ;

/*view dataset*/
proc print data = original_data; 

我们可以使用procContents函数来检查每个变量的类型:

 proc contents data =original_data; 

从结果中我们可以看出,球队位置是角色变量,而得分助攻是数值变量。

其他资源

以下教程解释了如何在 SAS 中执行其他常见任务:

如何在 SAS 中创建新变量
如何在SAS中替换字符串中的字符
SAS中如何用零替换缺失值
SAS中如何删除重复项

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注