Sas에서 aic를 계산하는 방법(예제 포함)


AIC(Akaike Information Criterion)는 여러 회귀 모델의 적합성을 비교하는 데 사용되는 측정항목입니다.

다음과 같이 계산됩니다.

AIC = 2K – 2ln (L)

금:

  • K: 모델 매개변수의 수입니다. K의 기본값은 2이므로 예측 변수가 하나만 있는 모델의 K 값은 2+1 = 3입니다.
  • ln (L) : 모델의 로그 우도입니다. 대부분의 통계 소프트웨어는 이 값을 자동으로 계산할 수 있습니다.

AIC는 데이터의 가장 큰 변화를 설명하는 모델을 찾는 동시에 과도한 수의 매개변수를 사용하는 모델에 페널티를 적용하도록 설계되었습니다.

여러 회귀 모델을 적용한 후에는 각 모델의 AIC 값을 비교할 수 있습니다. AIC가 낮을수록 적합한 모델입니다.

다음 예에서는 SAS의 다양한 회귀 모델에 대한 AIC를 계산하는 방법을 보여줍니다.

예: SAS에서 AIC를 계산하는 방법

학생들이 수업에서 달성할 시험 성적을 예측하기 위해 세 가지 다중 선형 회귀 모델을 적합화한다고 가정해 보겠습니다.

각 모델에서 사용할 예측 변수는 다음과 같습니다.

  • 모델 1의 예측 변수: 연구에 소요된 시간
  • 모델 2의 예측 변수: 과거 실기 시험
  • 모델 3의 예측 변수: 공부에 소비한 시간 및 연습 시험에 응시한 시간

먼저 다음 코드를 사용하여 학생 20명에 대한 이 정보가 포함된 데이터세트를 만듭니다.

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 96
5 4 90
3 4 82
4 4 85
6 5 99
2 1 83
1 0 62
2 1 76
;
run ;

다음으로, proc reg를 사용하여 이러한 각 회귀 모델을 맞추고 Selection=adjrsq sse aic 문을 사용하여 각 모델의 AIC 값을 계산합니다.

 /*fit multiple linear regression models and calculate AIC for each model*/
proc reg data =exam_data;
    model score = hours prep_exams / selection=adjrsq sse aic;
run ; 

SAS에서 AIC 계산

결과에서 각 모델의 AIC 값을 볼 수 있습니다.

  • 시간을 예측 변수로 사용하는 AIC: 68.4537
  • 시간과 시험을 예측 변수로 사용하는 AIC: 69.9507
  • 시험을 예측 변수로 사용하는 AIC: 91.4967

AIC 값이 가장 낮은 모델은 예측 변수로 시간만 포함하는 모델입니다.

따라서 우리는 다음 모델이 데이터에 가장 적합하다고 선언합니다.

점수 = β 0 + β 1 (공부한 시간)

이 모델을 가장 좋은 것으로 식별하면 이를 적합화하고 R 제곱 값과 베타 계수를 포함한 결과를 분석하여 공부한 시간과 학생 성적 사이의 정확한 관계를 결정할 수 있습니다. ‘최종 시험.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 단순 선형 회귀를 수행하는 방법
SAS에서 다중 선형 회귀를 수행하는 방법
SAS에서 R 제곱을 계산하는 방법
SAS에서 RMSE를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다