Sas에서 기술 통계를 계산하는 방법


기술 통계는 데이터 집합을 설명하는 값입니다.

이는 데이터 세트의 중심이 어디에 있는지, 데이터 세트 내 값의 분포를 이해하는 데 도움이 됩니다.

SAS에서 변수에 대한 기술 통계를 계산하는 두 가지 일반적인 방법이 있습니다.

1. PROC MEANS를 사용하여 요약 통계 계산

2. PROC UNIVARIATE를 사용하여 자세한 기술 통계를 계산합니다.

다음 예에서는 SAS의 다음 데이터 세트에서 실제로 각 방법을 사용하는 방법을 보여줍니다.

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

예 1. PROC MEANS를 사용하여 요약 통계 계산

다음 코드는 PROC MEANS를 사용하여 데이터 세트의 포인트 변수에 대한 요약 통계를 계산하는 방법을 보여줍니다.

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

PROC MEANS를 사용하는 SAS의 기술 통계

PROC MEANS 프로시저는 다음과 같은 기술 통계를 계산합니다.

  • N : 총 관측치 수
  • 평균 : 포인트의 평균값
  • Std Dev: 점의 표준편차
  • 최소 : 포인트의 최소값
  • 최대 : 포인트의 최대값

또한 class 문을 사용하여 한 변수에 대한 기술 통계를 다른 변수별로 그룹화하여 계산할 수 있습니다.

예를 들어, 다음 코드를 사용하여 변수별로 그룹화된 포인트 변수에 대한 요약 통계를 계산할 수 있습니다.

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

출력에는 각 고유 값별로 그룹화된 포인트 변수에 대한 요약 통계가 표시됩니다 .

예 2. PROC UNIVARIATE를 사용하여 자세한 기술 통계 계산

다음 코드는 PROC UNIVARIATE를 사용하여 포인트 변수에 대한 자세한 기술 통계를 계산하는 방법을 보여줍니다.

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

PROC UNIVARIATE 프로시저는 평균, 중앙값, 모드, 표준 편차, 분산, 범위, 사분위간 범위 등을 포함하여 변수에 대한 자세한 기술 통계를 계산합니다.

또한 class 문을 사용하여 변수별로 그룹화된 points 변수에 대한 자세한 설명 통계를 계산할 수 있습니다.

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

이렇게 하면 각 팀의 고유 값별로 그룹화된 포인트 변수에 대한 자세한 기술 통계를 표시하는 출력 테이블의 세 그룹이 생성됩니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 빈도표를 만드는 방법
SAS에서 백분위수를 계산하는 방법
SAS에서 피벗 테이블을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다