Sas에서 proc tabulate를 사용하는 방법(예제 포함)
SAS에서 proc tabulate를 사용하면 하나 이상의 변수에 대한 기술 통계를 표 형식으로 신속하게 표시할 수 있습니다.
다음 예에서는 12명의 서로 다른 농구 선수가 득점한 총점을 보여주는 다음 데이터세트에서 이 절차를 사용하는 방법을 보여줍니다.
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
예 1: Proc 변수를 사용하여 도표화
다음 코드를 사용하여 포인트 변수에 대한 기술 통계를 계산할 수 있습니다.
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
참고 : 괄호 안의 값은 SAS에 해당 포인트에 대해 계산할 기술 통계가 무엇인지 알려줍니다.
다음은 가장 일반적으로 사용되는 기술 통계 중 일부입니다.
- N : 총 관측치 수
- Min : 최소값
- Q1 : 첫 번째 분위수(즉, 25번째 백분위수)의 값
- 중앙값 : 중앙값
- 평균 : 평균값
- Q3 : 세 번째 분위수(즉, 75번째 백분위수)의 값
- Max : 최대값
결과에서 우리는 다음을 볼 수 있습니다:
- 총 관측치 수는 12개 입니다.
- 최소 포인트 값은 3 입니다.
- 25번째 백분위수의 포인트 수는 10.5 입니다.
- 점의 중앙값은 15.5 입니다.
- 평균 포인트 수는 16.92 입니다.
- 75번째 백분위수의 포인트 수는 22.5 입니다.
- 최대 포인트 수는 34개 입니다.
이 다섯 가지 값을 통해 Weight 변수 값의 분포를 상당히 잘 이해할 수 있습니다.
예 2: 두 개의 변수가 있는 Proc 표 작성
다음 코드를 사용하여 팀 변수별로 그룹화된 포인트 변수에 대한 기술 통계를 계산할 수 있습니다.
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
결과 테이블에는 세 팀 각각의 설명 점수 통계가 표시됩니다.
예를 들어:
- A팀에는 6개의 관측치가 있습니다.
- A팀의 최소 점수는 9점 입니다.
- A팀의 25번째 백분위수 점수는 12점 입니다.
- A팀의 평균 점수는 14점 입니다.
등등.
예 3: 세 개의 변수가 있는 Proc 표 작성
다음 코드를 사용하여 팀 및 위치 변수별로 그룹화된 포인트 변수에 대한 기술 통계를 계산할 수 있습니다.
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
결과 테이블에는 팀 및 포지션별로 그룹화된 포인트의 설명 통계가 표시됩니다.
팀 B에는 공격자 위치를 가진 선수가 없기 때문에 팀 “B” 및 “공격자” 위치의 셀은 비어 있습니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS에서 절차 요약을 사용하는 방법
SAS에서 상관관계를 계산하는 방법
SAS에서 빈도표를 만드는 방법
SAS에서 그룹별로 상자 그림을 만드는 방법