Sas에서 빈도표를 만드는 방법(예제 포함)
SAS에서 proc freq를 사용하여 데이터 세트에 있는 하나 이상의 변수에 대한 빈도 테이블을 빠르게 생성할 수 있습니다.
다음 예는 최근 출산한 100,000명의 산모의 다양한 특성을 포함하는 BirthWgt 라는 SAS 내장 데이터 세트와 함께 이 프로시저를 사용하는 방법을 보여줍니다.
proc print를 사용하여 이 데이터세트의 처음 10개 관측치를 표시할 수 있습니다.
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
예 1: 변수의 빈도표
다음 코드를 사용하여 Race 변수에 대한 빈도 테이블을 만들 수 있습니다.
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
출력 테이블에는 다음 네 개의 열이 포함됩니다.
- 빈도 : 특정 범주에 속하는 총 관측 수입니다.
- 백분율 : 특정 범주에 속하는 전체 관측치의 백분율입니다.
- 누적 빈도 : 현재 행을 포함하여 최대로 고려된 총 관측치 수입니다.
- 누적 백분율 : 현재 행까지 고려된 총 관측치의 누적 백분율입니다.
예를 들어 출력 테이블에서 다음을 볼 수 있습니다.
- 히스패닉계 어머니의 총 수는 22,139 명이었습니다.
- 히스패닉계 어머니의 전체 비율은 22.14% 였습니다.
- 아시아계, 흑인계, 히스패닉계 어머니의 총 수는 41,496명 이었습니다.
- 아시아인, 흑인, 히스패닉계 어머니의 누적 비율은 41.50% 였습니다.
예 2: 변수의 빈도표(정렬됨)
기본적으로 빈도표는 범주 이름을 기준으로 알파벳순으로 정렬됩니다. 그러나 order 함수를 사용하여 빈도별로 범주를 정렬할 수 있습니다.
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
이제 카테고리는 빈도를 기준으로 가장 높은 것부터 가장 낮은 것까지 정렬됩니다.
예 3: 변수의 빈도표(결측값 포함)
기본적으로 결측값은 빈도표에 포함되지 않습니다.
그러나 누락된 값의 빈도를 계산하는 행을 포함하도록 SAS에 지시하기 위해 누락된 명령을 사용할 수 있습니다.
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
빈도표에 추가 행이 추가되지 않았으므로 이는 원래 데이터 세트에 인종에 대한 누락 값이 없음을 나타냅니다.
예시 4: 여러 변수에 대한 빈도표
여러 변수에 대한 빈도표를 한 번에 만들려면 단순히 테이블 인수에 여러 변수 이름을 포함하면 됩니다.
예를 들어, 다음 코드를 사용하여 Race 및 AgeGroup에 대한 빈도 테이블을 만들 수 있습니다.
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
두 변수에 대한 빈도표가 생성된 것을 볼 수 있습니다.