Sas: 정규성 테스트를 위해 proc 일변량을 사용하는 방법


SAS에서 일반 문과 함께 proc 일변량을 사용하여 데이터 세트의 변수에 대해 여러 정규성 테스트를 수행할 수 있습니다.

이 절차에서는 다음 기본 구문을 사용합니다.

 proc univariate data =my_data normal ;
    var my_variable;
run ;

다음 예에서는 이 절차를 실제로 사용하는 방법을 보여줍니다.

예: SAS의 정규성 테스트를 위한 Proc Univariate

SAS에 다양한 농구 선수에 대한 정보가 포함된 다음과 같은 데이터 세트가 있다고 가정합니다.

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

proc univariate를 일반 문과 함께 사용하여 points 변수에 대한 다양한 정규성 테스트를 수행할 수 있습니다.

 proc univariate data =my_data normal ;
    var points;
run ;

결과에는 여러 테이블이 표시되지만 정규성 테스트 라는 제목의 테이블에는 정규성 테스트 결과가 포함되어 있습니다.

SAS proc 일변량 정규성 테스트

기본적으로 SAS는 4가지 정규성 검정을 수행하고 각 검정 통계량과 해당 p-값을 표시합니다.

  • Shapiro-Wilk 검정 : W = 0.867, p = 0.0383
  • 콜모고로프-스미르노프 검정 : D = .237, p = .0318
  • 크라머-폰 미제스 검정 : W-Sq = 0.152, p = 0.0200
  • Anderson-Darling 검정 : A-Sq = 0.847, p = 0.0223

각 정규성 검정에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • H 0 : 데이터가 정규 분포를 따릅니다.
  • H A : 데이터가 정규 분포를 따르지 않습니다.

각 정규성 검정의 p-값이 0.05보다 작으므로 각 정규성 검정에 대한 귀무가설을 기각합니다.

이는 포인트 변수가 정규 분포를 따르지 않는다는 결론을 내릴 수 있는 충분한 증거가 있음을 의미합니다.

포인트 변수 값의 분포를 시각화하기 위해 정규 곡선이 겹쳐진 히스토그램을 만들 수도 있습니다.

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

히스토그램을 보면 값의 분포가 정규 곡선을 잘 따르지 않는 것을 알 수 있는데, 이는 우리가 수행한 정규성 테스트 결과와 일치합니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 절차 요약을 사용하는 방법
SAS에서 Proc Tabulate를 사용하는 방법
SAS에서 Proc 대조를 사용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다