Sas で proc surveyselect を使用する方法 (例あり)
PROC SURVEYSELECTを使用して、SAS のデータセットからランダムなサンプルを選択できます。
この手順を実際に使用する一般的な 3 つの方法を次に示します。
例 1: PROC SURVEYSELECT を使用して単純なランダム サンプルを選択する
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
この特定の例では、データセットから 5 つのランダムな観測値を選択します。
例 2: PROC SURVEYSELECT を使用して層別無作為サンプルを選択する
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
この特定の例では、データセットの一意の各層から 2 つのランダムな観測値を選択します。
strataステートメントは、階層化に使用する変数を指定します。
例 3: PROC SURVEYSELECT を使用してプールされたランダム サンプルを選択する
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
この特定の例では、データセットから 2 つのランダムなクラスターを選択し、サンプル内のすべてのクラスターからのすべての観測値を含めます。
クラスターステートメントは、クラスター化に使用する変数を指定します。
次の例は、さまざまなチームのバスケットボール選手に関する情報を含む SAS の次のデータセットを使用して各メソッドを実際に使用する方法を示しています。
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
例 1: PROC SURVEYSELECT を使用して単純なランダム サンプルを選択する
次の構文を使用して、データセットから 5 つの観測値の 単純なランダム サンプルを選択できます。
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
結果のサンプルには、データセットからランダムに選択された 5 つの観測値が含まれます。
例 2: PROC SURVEYSELECT を使用して層別無作為サンプルを選択する
次の構文を使用して、各チームから 2 つの観測値がランダムに選択されてサンプルに含まれる層化ランダム サンプリングを実行できます。
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
結果のサンプルには、各チームからランダムに選択された 2 つの観測値が含まれます。
関連: クラスター サンプリングと層化サンプリング: 違いは何ですか?
例 3: PROC SURVEYSELECT を使用してプールされたランダム サンプルを選択する
次の構文を使用して、クラスター化されたランダム サンプリングを実行できます。このサンプリングでは、チームをクラスターとして使用し、ランダムに 2 つのクラスターを選択し、これらのクラスターからの各観測値をサンプルに含めます。
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
この特定のサンプルには、ランダムに選択された 2 つの「クラスター」であるチーム A と B からのすべての観測値が含まれています。
注: PROC SURVEYSELECT の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。
SAS で記述統計を計算する方法
SAS で度数表を作成する方法
SAS でパーセンタイルを計算する方法
SAS でピボットテーブルを作成する方法