Sas에서 기술 통계를 계산하는 방법
기술 통계는 데이터 집합을 설명하는 값입니다.
이는 데이터 세트의 중심이 어디에 있는지, 데이터 세트 내 값의 분포를 이해하는 데 도움이 됩니다.
SAS에서 변수에 대한 기술 통계를 계산하는 두 가지 일반적인 방법이 있습니다.
1. PROC MEANS를 사용하여 요약 통계 계산
2. PROC UNIVARIATE를 사용하여 자세한 기술 통계를 계산합니다.
다음 예에서는 SAS의 다음 데이터 세트에서 실제로 각 방법을 사용하는 방법을 보여줍니다.
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
예 1. PROC MEANS를 사용하여 요약 통계 계산
다음 코드는 PROC MEANS를 사용하여 데이터 세트의 포인트 변수에 대한 요약 통계를 계산하는 방법을 보여줍니다.
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
PROC MEANS 프로시저는 다음과 같은 기술 통계를 계산합니다.
- N : 총 관측치 수
- 평균 : 포인트의 평균값
- Std Dev: 점의 표준편차
- 최소 : 포인트의 최소값
- 최대 : 포인트의 최대값
또한 class 문을 사용하여 한 변수에 대한 기술 통계를 다른 변수별로 그룹화하여 계산할 수 있습니다.
예를 들어, 다음 코드를 사용하여 팀 변수별로 그룹화된 포인트 변수에 대한 요약 통계를 계산할 수 있습니다.
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
출력에는 각 고유 팀 값별로 그룹화된 포인트 변수에 대한 요약 통계가 표시됩니다 .
예 2. PROC UNIVARIATE를 사용하여 자세한 기술 통계 계산
다음 코드는 PROC UNIVARIATE를 사용하여 포인트 변수에 대한 자세한 기술 통계를 계산하는 방법을 보여줍니다.
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
PROC UNIVARIATE 프로시저는 평균, 중앙값, 모드, 표준 편차, 분산, 범위, 사분위간 범위 등을 포함하여 점 변수에 대한 자세한 기술 통계를 계산합니다.
또한 class 문을 사용하여 팀 변수별로 그룹화된 points 변수에 대한 자세한 설명 통계를 계산할 수 있습니다.
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
이렇게 하면 각 팀의 고유 값별로 그룹화된 포인트 변수에 대한 자세한 기술 통계를 표시하는 출력 테이블의 세 그룹이 생성됩니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.