如何在 sas 中使用 proc surveyselect(附示例)


您可以使用PROC SURVEYSELECT从 SAS 数据集中选择随机样本。

以下是在实践中使用此过程的三种常见方法:

示例 1:使用 PROC SURVEYSELECT 选择简单的随机样本

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

此特定示例从数据集中选择 5 个随机观察值。

示例 2:使用 PROC SURVEYSELECT 选择分层随机样本

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

此特定示例从数据集的每个独特层中选择 2 个随机观测值。

strata语句指定用于分层的变量。

示例 3:使用 PROC SURVEYSELECT 选择合并的随机样本

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

此特定示例从数据集中选择 2 个随机聚类,并包含样本中每个聚类的每个观察结果。

cluster语句指定用于聚类的变量。

以下示例展示了如何在 SAS 中的以下数据集(包含来自不同球队的篮球运动员的信息)中实际使用每种方法:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

示例 1:使用 PROC SURVEYSELECT 选择简单的随机样本

我们可以使用以下语法从数据集中选择 5 个观测值的简单随机样本

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

生成的样本包含从数据集中随机选择的 5 个观测值

示例 2:使用 PROC SURVEYSELECT 选择分层随机样本

我们可以使用以下语法来执行分层随机抽样,其中从每个团队中随机选择 2 个观察值以包含在样本中:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

生成的样本包含每个团队随机选择的 2 个观察值

相关:整群抽样和分层抽样:有什么区别?

示例 3:使用 PROC SURVEYSELECT 选择合并的随机样本

我们可以使用以下语法来执行聚类随机抽样,其中我们使用团队作为聚类并随机选择 2 个聚类,并将这些聚类中的每个观察结果包含在样本中:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

这个特定样本包含来自 A 组和 B 组的所有观察结果,这是两个随机选择的“集群”。

注意:您可以在此处找到完整的PROC SURVEYSELECT文档。

其他资源

以下教程解释了如何在 SAS 中执行其他常见任务:

如何在 SAS 中计算描述性统计
如何在SAS中创建频率表
如何在 SAS 中计算百分位数
如何在 SAS 中创建数据透视表

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注