如何在 sas 中计算描述性统计
描述性统计是描述一组数据的值。
它们帮助我们了解数据集的中心在哪里以及数据集中值的分布。
SAS 中有两种计算变量描述性统计的常用方法:
1.使用PROC MEANS计算汇总统计
2.使用PROC UNIVARIATE计算详细的描述统计量
以下示例展示了如何在 SAS 中的以下数据集上实际使用每种方法:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
示例 1. 使用 PROC MEANS 计算汇总统计量
以下代码显示如何使用PROC MEANS计算数据集中的点变量的汇总统计量:
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
PROC MEANS过程计算以下描述性统计数据:
- N :观察总数
- 平均值:点的平均值
- Std Dev:点的标准差
- 最小值:点的最小值
- 最大值:点数的最大值
另请注意,您可以使用 class 语句来计算由另一个变量分组的一个变量的描述性统计数据。
例如,我们可以使用以下代码来计算按团队变量分组的积分变量的汇总统计数据:
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
输出显示点变量的汇总统计数据,按每个唯一的团队值分组。
示例 2. 使用 PROC UNIVARIATE 计算详细的描述统计量
以下代码显示了如何使用PROC UNIVARIATE计算点变量的详细描述统计量:
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
PROC UNIVARIATE过程计算点变量的详细描述性统计数据,包括均值、中位数、众数、标准差、方差、极差、四分位距等。
我们还可以使用class语句来计算Points变量的详细描述性统计数据,并按团队变量分组:
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
这将生成三组输出表,显示点变量的详细描述性统计数据,并按每个团队的唯一值进行分组。
其他资源
以下教程解释了如何在 SAS 中执行其他常见任务: