如何在 sas 中选择随机样本:示例


以下是从 SAS 数据集中选择简单随机行样本的两种最常见方法:

方法 1:使用样本量选择随机样本

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

方法 2:使用总观测值的比例选择随机样本

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

以下示例展示了如何在 SAS 中对以下数据集使用每种方法:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

示例 1:使用样本大小选择随机样本

以下代码显示如何使用 n=3 的样本大小从数据集中选择观察值的随机样本:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

我们可以看到从原始数据集中随机选择了三行。

示例 2:使用总观测值的比例选择随机样本

以下代码演示了如何使用samprate函数从数据集中选择观测值的随机样本,以指定我们希望随机样本代表所有原始观测值的 20%:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

我们可以看到,原始数据集中的总观测值的 20%(20% * 10 个观测值 = 2 )被随机选择作为我们样本的一部分。

其他资源

以下教程解释了如何在 SAS 中执行其他常见任务:

如何在SAS中使用过程摘要
如何在SAS中重命名变量
如何在 SAS 中创建新变量

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注