Sas에서 절차 요약을 사용하는 방법(예제 포함)


SAS의 절차 요약을 사용하면 데이터 세트에 있는 하나 이상의 변수에 대해 다음과 같은 기술 통계를 빠르게 계산할 수 있습니다.

  • N : 총 관측치 수
  • MIN : 최소값
  • MAX : 최대값
  • 평균 : 평균
  • STD : 표준편차

다음 예에서는 Fish 라는 SAS 내장 데이터세트와 함께 이 절차를 사용하는 방법을 보여줍니다. 여기에는 핀란드의 한 호수에서 잡힌 159종의 다양한 물고기에 대한 다양한 측정값이 포함되어 있습니다.

proc print를 사용하여 이 데이터세트의 처음 10개 관측치를 표시할 수 있습니다.

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

관련 항목: SAS에서 이상값을 식별하는 방법

예 1: 변수를 사용한 절차 요약

다음 코드를 사용하여 Weight 변수에 대한 기술 통계를 계산할 수 있습니다.

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

출력 테이블을 해석하는 방법은 다음과 같습니다.

  • _TYPE_: 이 열은 데이터 세트의 각 행이 기술 통계를 계산하는 데 사용되었는지 여부를 나타냅니다. 0 = 모든 라인이 사용되었습니다.
  • _FREQ_: 각 기술 통계를 계산하는 데 사용되는 행 수입니다.
  • _STAT_: 기술 통계의 이름입니다.
  • 가중치: 해당 기술 통계의 수치 값입니다.

결과에서 우리는 다음을 볼 수 있습니다:

  • 총 관찰 수는 158개 였습니다.
  • 최소 가중치 값은 0 입니다.
  • 최대 중량 값은 1,650 입니다.
  • 평균 체중 값은 398.70 이었습니다.
  • 가중치 값의 표준편차는 359.09 이다.

이 다섯 가지 값을 통해 Weight 변수 값의 분포를 상당히 잘 이해할 수 있습니다.

예 2: 여러 변수가 있는 프로세스 요약

여러 변수에 대한 기술 통계를 한 번에 계산하려면 var 문에 여러 변수 이름을 나열하면 됩니다.

예를 들어, 다음 코드를 사용하여 Weight 및 Height 변수에 대한 기술 통계를 계산할 수 있습니다.

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

결과에서 우리는 체중과 신장에 대한 5가지 기술 통계를 볼 수 있습니다.

예 3: 한 변수를 다른 변수로 그룹화한 프로세스 요약

다른 변수로 그룹화된 변수에 대한 기술 통계를 계산하려면 class 문을 사용할 수 있습니다.

예를 들어, 다음 코드를 사용하여 종별로 그룹화된 체중에 대한 기술 통계를 계산할 수 있습니다.

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

출력 테이블에는 각 어종에 대한 기술 통계가 표시됩니다.

예를 들어, 도미 물고기에 대해서만 다음과 같은 기술 통계를 관찰할 수 있습니다.

  • 총 관찰 수는 34개 였습니다.
  • 최소 가중치 값은 242 입니다.
  • 최대 가중치 값은 1000 입니다.
  • 평균 체중 값은 626 이었습니다.
  • 가중치 값의 표준편차는 206.60 이었다.

우리는 또한 다른 모든 종에 대한 이러한 기술 통계를 관찰할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 Proc Append를 사용하는 방법
SAS에서 Proc Tabulate를 사용하는 방법
SAS에서 상관관계를 계산하는 방법
SAS에서 빈도표를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다