Sas에서 절차 요약을 사용하는 방법(예제 포함)
SAS의 절차 요약을 사용하면 데이터 세트에 있는 하나 이상의 변수에 대해 다음과 같은 기술 통계를 빠르게 계산할 수 있습니다.
- N : 총 관측치 수
- MIN : 최소값
- MAX : 최대값
- 평균 : 평균
- STD : 표준편차
다음 예에서는 Fish 라는 SAS 내장 데이터세트와 함께 이 절차를 사용하는 방법을 보여줍니다. 여기에는 핀란드의 한 호수에서 잡힌 159종의 다양한 물고기에 대한 다양한 측정값이 포함되어 있습니다.
proc print를 사용하여 이 데이터세트의 처음 10개 관측치를 표시할 수 있습니다.
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
관련 항목: SAS에서 이상값을 식별하는 방법
예 1: 변수를 사용한 절차 요약
다음 코드를 사용하여 Weight 변수에 대한 기술 통계를 계산할 수 있습니다.
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
출력 테이블을 해석하는 방법은 다음과 같습니다.
- _TYPE_: 이 열은 데이터 세트의 각 행이 기술 통계를 계산하는 데 사용되었는지 여부를 나타냅니다. 0 = 모든 라인이 사용되었습니다.
- _FREQ_: 각 기술 통계를 계산하는 데 사용되는 행 수입니다.
- _STAT_: 기술 통계의 이름입니다.
- 가중치: 해당 기술 통계의 수치 값입니다.
결과에서 우리는 다음을 볼 수 있습니다:
- 총 관찰 수는 158개 였습니다.
- 최소 가중치 값은 0 입니다.
- 최대 중량 값은 1,650 입니다.
- 평균 체중 값은 398.70 이었습니다.
- 가중치 값의 표준편차는 359.09 이다.
이 다섯 가지 값을 통해 Weight 변수 값의 분포를 상당히 잘 이해할 수 있습니다.
예 2: 여러 변수가 있는 프로세스 요약
여러 변수에 대한 기술 통계를 한 번에 계산하려면 var 문에 여러 변수 이름을 나열하면 됩니다.
예를 들어, 다음 코드를 사용하여 Weight 및 Height 변수에 대한 기술 통계를 계산할 수 있습니다.
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
결과에서 우리는 체중과 신장에 대한 5가지 기술 통계를 볼 수 있습니다.
예 3: 한 변수를 다른 변수로 그룹화한 프로세스 요약
다른 변수로 그룹화된 변수에 대한 기술 통계를 계산하려면 class 문을 사용할 수 있습니다.
예를 들어, 다음 코드를 사용하여 종별로 그룹화된 체중에 대한 기술 통계를 계산할 수 있습니다.
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
출력 테이블에는 각 어종에 대한 기술 통계가 표시됩니다.
예를 들어, 도미 물고기에 대해서만 다음과 같은 기술 통계를 관찰할 수 있습니다.
- 총 관찰 수는 34개 였습니다.
- 최소 가중치 값은 242 입니다.
- 최대 가중치 값은 1000 입니다.
- 평균 체중 값은 626 이었습니다.
- 가중치 값의 표준편차는 206.60 이었다.
우리는 또한 다른 모든 종에 대한 이러한 기술 통계를 관찰할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS에서 Proc Append를 사용하는 방법
SAS에서 Proc Tabulate를 사용하는 방법
SAS에서 상관관계를 계산하는 방법
SAS에서 빈도표를 만드는 방법