Sas에서 무작위 표본을 선택하는 방법: 예 포함


SAS의 데이터세트에서 단순 무작위 행 샘플을 선택하는 가장 일반적인 두 가지 방법은 다음과 같습니다.

방법 1: 표본 크기를 사용하여 무작위 표본 선택

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

방법 2: 전체 관측치의 비율을 사용하여 무작위 표본 선택

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

다음 예에서는 SAS의 다음 데이터 세트에 각 방법을 사용하는 방법을 보여줍니다.

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

예 1: 표본 크기를 사용하여 무작위 표본 선택

다음 코드는 n=3의 샘플 크기를 사용하여 데이터 세트에서 관측치의 무작위 샘플을 선택하는 방법을 보여줍니다.

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

원본 데이터세트에서 세 개의 행이 무작위로 선택된 것을 볼 수 있습니다.

예 2: 전체 관측치의 비율을 사용하여 무작위 표본 선택

다음 코드는 samprate 함수를 사용하여 데이터 세트에서 관측치의 무작위 샘플을 선택하여 무작위 샘플이 모든 원래 관측치의 20%를 나타내도록 지정하는 방법을 보여줍니다.

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

원래 데이터 세트의 전체 관측치 중 20%(20% * 10개의 관측치 = 2 )가 표본의 일부로 무작위로 선택되었음을 알 수 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 절차 요약을 사용하는 방법
SAS에서 변수 이름을 바꾸는 방법
SAS에서 새 변수를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다