SAS의 데이터세트에서 단순 무작위 행 샘플을 선택하는 가장 일반적인 두 가지 방법은 다음과 같습니다. 방법 1: 표본 크기를 사용하여 무작위 표본 선택 proc surveyselect data =original_data out =random_sample method =srs /*specify simple random sampling as sampling method*/ sampsize =3 /*select 3...
SAS에서 데이터 세트의 처음 N 행을 선택하는 가장 일반적인 두 가지 방법은 다음과 같습니다. 방법 1: 첫 번째 행 선택 data first_row; set original_data; if _N_ = 1 then output ; run ; 방법 2: 처음 N개 행 선택 data first_N_rows;...
SAS의 COALESCE 함수를 사용하여 데이터 세트의 각 행에서 누락되지 않은 첫 번째 값을 반환할 수 있습니다. 다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다. 예: SAS에서 COALESCE를 사용하는 방법 SAS에 누락된 값이 포함된 다음 데이터 세트가 있다고 가정합니다. /*create dataset*/ data...
이상값 은 데이터 세트의 다른 값과 비정상적으로 멀리 떨어져 있는 관측값입니다. 이상값은 분석 결과에 영향을 미칠 수 있으므로 문제가 될 수 있습니다. 데이터 세트에서 이상값을 식별하는 가장 일반적인 방법은 사분위간 범위를 사용하는 것입니다. IQR(사분위수 범위)은 데이터 세트에서 75번째 백분위수(Q3)와 25번째 백분위수(Q1)...
SAS의 RETAIN 함수를 사용하여 데이터 세트의 변수를 빠르게 재정렬할 수 있습니다. 이 기능을 사용하는 가장 일반적인 세 가지 방법은 다음과 같습니다. 방법 1: 모든 변수 재배열 data new_data; retain var4 var5 var1 var3 var2; set original_data; run ; 방법 2: 변수를...
더미 변수는 범주형 변수를 0 또는 1의 두 값 중 하나를 취하는 숫자 변수로 나타낼 수 있도록 회귀 분석에서 생성하는 변수 유형입니다. 예를 들어, 다음과 같은 데이터 세트가 있고 나이 와 결혼 상태를 사용하여 소득을 예측한다고 가정해 보겠습니다. 회귀 모델에서 결혼...
SAS에서 행을 삭제하는 가장 일반적인 세 가지 방법은 다음과 같습니다. 방법 1: 단일 조건에 따라 행 삭제 data new_data; set original_data; if var1 = " string " then delete; run ; 방법 2: 여러 조건에 따라 행 삭제 data new_data; set...
다음 방법을 사용하여 SAS에서 문자열을 대문자, 소문자 및 적절한 대소문자로 변환할 수 있습니다. 방법 1: 문자열을 대문자로 변환 new_string = UPCASE (old_string); 방법 2: 문자열을 소문자로 변환 new_string = LOWCASE (old_string); 방법 3: 문자열을 적절한 대소문자로 변환 new_string = PROPCASE (old_string);...
SAS에서 DAY , MONTH , YEAR 함수를 사용하면 날짜 변수에서 일, 월, 연도를 숫자 값으로 추출할 수 있습니다. 다음 예에서는 이러한 기능을 실제로 사용하는 방법을 보여줍니다. 예시 1: SAS의 날짜에서 일, 월, 연도 추출 SAS에 7명의 생년월일을 보여주는 다음 데이터 세트가...
SAS의 datalines 문을 사용하면 처음부터 새로운 데이터세트를 빠르게 생성할 수 있습니다. 이를 위해 다음 기본 구문을 사용할 수 있습니다. data original_data; input var1 $var2; datalines ; AT 12 B 19 C23 D 40 ; run ; 각 명령이 수행하는 작업은 다음과...