Sas でランダムサンプルを選択する方法: 例付き
SAS のデータセットから行の 単純でランダムなサンプルを選択する最も一般的な 2 つの方法を次に示します。
方法 1: サンプル サイズを使用してランダムなサンプルを選択する
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
sampsize =3 /*select 3 observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
方法 2: 合計観測値の割合を使用してランダムなサンプルを選択する
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
samprate =0.2 /*select 20% of all observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
次の例は、SAS の次のデータセットで各メソッドを使用する方法を示しています。
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;
/*view dataset*/
proc print data = original_data;
例 1: サンプルサイズを使用してランダムサンプルを選択する
次のコードは、サンプル サイズ n=3 を使用してデータセットから観測値のランダムなサンプルを選択する方法を示しています。
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
sampsize =3
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
元のデータセットから 3 つの行がランダムに選択されたことがわかります。
例 2: 合計観測値の割合を使用してランダムなサンプルを選択する
次のコードは、 samprate関数を使用してデータセットから観測値のランダムなサンプルを選択し、ランダムなサンプルが元のすべての観測値の 20% を表すように指定する方法を示しています。
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
samprate =0.2
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
元のデータセットの合計観測値の 20% (20% * 10 観測値 = 2 ) がサンプルの一部としてランダムに選択されたことがわかります。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。