如何在 sas 中使用 proc surveyselect(附示例)
您可以使用PROC SURVEYSELECT从 SAS 数据集中选择随机样本。
以下是在实践中使用此过程的三种常见方法:
示例 1:使用 PROC SURVEYSELECT 选择简单的随机样本
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
此特定示例从数据集中选择 5 个随机观察值。
示例 2:使用 PROC SURVEYSELECT 选择分层随机样本
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
此特定示例从数据集的每个独特层中选择 2 个随机观测值。
strata语句指定用于分层的变量。
示例 3:使用 PROC SURVEYSELECT 选择合并的随机样本
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
此特定示例从数据集中选择 2 个随机聚类,并包含样本中每个聚类的每个观察结果。
cluster语句指定用于聚类的变量。
以下示例展示了如何在 SAS 中的以下数据集(包含来自不同球队的篮球运动员的信息)中实际使用每种方法:
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
示例 1:使用 PROC SURVEYSELECT 选择简单的随机样本
我们可以使用以下语法从数据集中选择 5 个观测值的简单随机样本:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
生成的样本包含从数据集中随机选择的 5 个观测值。
示例 2:使用 PROC SURVEYSELECT 选择分层随机样本
我们可以使用以下语法来执行分层随机抽样,其中从每个团队中随机选择 2 个观察值以包含在样本中:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
生成的样本包含每个团队随机选择的 2 个观察值。
示例 3:使用 PROC SURVEYSELECT 选择合并的随机样本
我们可以使用以下语法来执行聚类随机抽样,其中我们使用团队作为聚类并随机选择 2 个聚类,并将这些聚类中的每个观察结果包含在样本中:
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
这个特定样本包含来自 A 组和 B 组的所有观察结果,这是两个随机选择的“集群”。
注意:您可以在此处找到完整的PROC SURVEYSELECT文档。
其他资源
以下教程解释了如何在 SAS 中执行其他常见任务: