如何在 sas 中使用过程摘要(附示例)
您可以使用 SAS 中的过程摘要来快速计算数据集中一个或多个变量的以下描述性统计量:
- N :观察总数
- MIN :最小值
- MAX :最大值
- 平均:平均数
- STD :标准偏差
以下示例演示如何将此过程与名为Fish的 SAS 内置数据集结合使用,该数据集包含在芬兰湖泊中捕获的 159 种不同鱼类的各种测量值。
我们可以使用proc print来显示该数据集的前 10 个观测值:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
示例 1:使用变量的过程摘要
我们可以使用以下代码来计算 Weight 变量的描述性统计量:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
以下是如何解释输出表:
- _TYPE_:此列指示数据集中的每一行是否用于计算描述性统计量。 0 = 每行都已被使用。
- _FREQ_:用于计算每个描述性统计量的行数。
- _STAT_:描述性统计的名称。
- 权重:相应描述性统计量的数值。
从结果我们可以看出:
- 观察总数为158 。
- 最小权重值为0 。
- 最大权重值为1,650 。
- 平均体重值为398.70 。
- 权重值的标准差为359.09 。
从这五个值中,我们可以很好地了解 Weight 变量的值的分布。
示例 2:具有多个变量的流程摘要
要一次计算多个变量的描述统计量,只需在var语句中列出多个变量名称即可。
例如,我们可以使用以下代码来计算变量 Weight 和 Height 的描述性统计量:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
从结果中我们可以看到体重和身高的五个描述性统计数据。
示例 3:一个变量由另一个变量分组的过程摘要
要计算由另一个变量分组的变量的描述性统计量,我们可以使用class语句。
例如,我们可以使用以下代码来计算按物种分组的体重的描述性统计:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
输出表显示每种鱼类的描述性统计数据。
例如,我们可以单独观察鳊鱼的以下描述性统计数据:
- 观察总数为34 。
- 最小权重值为242 。
- 最大权重值为1000 。
- 平均体重值为626 。
- 权重值的标准差为206.60 。
我们还可以观察所有其他物种的这些描述性统计数据。
其他资源
以下教程解释了如何在 SAS 中执行其他常见任务:
如何在 SAS 中使用 Proc Append
如何在 SAS 中使用 Proc Tabulate
如何在SAS中计算相关性
如何在SAS中创建频率表