Sas에서 무작위 표본을 선택하는 방법: 예 포함
SAS의 데이터세트에서 단순 무작위 행 샘플을 선택하는 가장 일반적인 두 가지 방법은 다음과 같습니다.
방법 1: 표본 크기를 사용하여 무작위 표본 선택
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
sampsize =3 /*select 3 observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
방법 2: 전체 관측치의 비율을 사용하여 무작위 표본 선택
proc surveyselect data =original_data
out =random_sample
method =srs /*specify simple random sampling as sampling method*/
samprate =0.2 /*select 20% of all observations randomly*/
seed =123; /*set seed to make this example reproducible*/
run ;
다음 예에서는 SAS의 다음 데이터 세트에 각 방법을 사용하는 방법을 보여줍니다.
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;
/*view dataset*/
proc print data = original_data;
예 1: 표본 크기를 사용하여 무작위 표본 선택
다음 코드는 n=3의 샘플 크기를 사용하여 데이터 세트에서 관측치의 무작위 샘플을 선택하는 방법을 보여줍니다.
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
sampsize =3
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
원본 데이터세트에서 세 개의 행이 무작위로 선택된 것을 볼 수 있습니다.
예 2: 전체 관측치의 비율을 사용하여 무작위 표본 선택
다음 코드는 samprate 함수를 사용하여 데이터 세트에서 관측치의 무작위 샘플을 선택하여 무작위 샘플이 모든 원래 관측치의 20%를 나타내도록 지정하는 방법을 보여줍니다.
/*select random sample*/
proc surveyselect data =original_data
out =random_sample
method =srs
samprate =0.2
seed =123;
run ;
/*view random sample*/
proc print data =random_sample;
원래 데이터 세트의 전체 관측치 중 20%(20% * 10개의 관측치 = 2 )가 표본의 일부로 무작위로 선택되었음을 알 수 있습니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.