Sas에서 왜도 및 첨도를 계산하는 방법


통계에서 왜도와 첨도는 분포의 모양을 측정하는 두 가지 방법입니다.

왜도는 분포의 비대칭성을 측정합니다.

  • 음의 왜도는 꼬리가 분포의 왼쪽에 있음을 나타냅니다.
  • 양의 치우침은 꼬리가 분포의 오른쪽에 있음을 나타냅니다.
  • 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.

첨도는 정규 분포 와 비교하여 분포가 두꺼운 꼬리인지 얇은 꼬리인지를 측정합니다.

  • 정규분포의 첨도는 0입니다.
  • 주어진 분포의 첨도가 0보다 작은 경우 플레이커틱(playkurtic) 이라고 하며, 이는 정규 분포보다 더 적은 수의 극단적인 이상값을 생성하는 경향이 있음을 의미합니다.
  • 특정 분포의 첨도가 0보다 큰 경우 이를 leptokurtic 이라고 합니다. 이는 정규 분포보다 더 많은 이상값을 생성하는 경향이 있음을 의미합니다.

SAS에서 변수의 왜도와 첨도를 계산하려면 PROC MEANS 에서 SKEWNESSKURTOSIS 문을 사용할 수 있습니다.

다음 예에서는 이러한 지침을 실제로 사용하는 방법을 보여줍니다.

예: SAS에서 왜도 및 첨도 계산

SAS에 다양한 농구 선수에 대한 정보가 포함된 다음과 같은 데이터 세트가 있다고 가정합니다.

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

SKEWNESSKURTOSIS 문과 함께 PROC MEANS를 사용하여 데이터세트에 있는 각 숫자 변수의 왜도와 첨도를 계산할 수 있습니다.

 /*calculate skewness and kurtosis for each numeric variable*/
proc means data =my_data SKEWNESS KURTOSIS ;
run ; 

출력 테이블에는 데이터 세트의 각 숫자 변수에 대한 왜도 및 첨도 값이 표시됩니다.

(1) 포인트

  • points 변수의 왜도1.009 입니다. 이 값이 0보다 크므로 꼬리가 분포의 오른쪽에 있다는 의미입니다.
  • points 변수의 첨도-0.299 입니다. 이 값이 0보다 작기 때문에 정규분포에 비해 이상치가 약간 적고 극단값도 적다는 의미입니다.

(2) 도움

  • 지원 변수의 왜도0.304 입니다. 이 값이 0보다 크므로 꼬리가 분포의 오른쪽에 있다는 의미입니다.
  • 지원 변수의 첨도-0.782 입니다. 이 값이 0보다 작으므로 정규분포에 비해 이상값이 적고 극단값도 적다는 의미입니다.

데이터 세트의 각 숫자 변수에 대한 값 분포를 시각화하려면 PROC UNIVARIATE를 사용하여 점 및 보조 변수에 대한 히스토그램을 생성할 수 있습니다.

 /*create histograms for points and assists variables*/
proc univariate data =my_data;
    var points assists;
    histogram points assists;
run ;

그러면 포인트 변수에 대해 다음과 같은 히스토그램이 생성됩니다.

지원 변수에 대한 다음 히스토그램은 다음과 같습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 기술 통계를 계산하는 방법
SAS에서 빈도표를 만드는 방법
SAS에서 백분위수를 계산하는 방법
SAS에서 피벗 테이블을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다