Sas에서 aic를 계산하는 방법(예제 포함)
AIC(Akaike Information Criterion)는 여러 회귀 모델의 적합성을 비교하는 데 사용되는 측정항목입니다.
다음과 같이 계산됩니다.
AIC = 2K – 2ln (L)
금:
- K: 모델 매개변수의 수입니다. K의 기본값은 2이므로 예측 변수가 하나만 있는 모델의 K 값은 2+1 = 3입니다.
- ln (L) : 모델의 로그 우도입니다. 대부분의 통계 소프트웨어는 이 값을 자동으로 계산할 수 있습니다.
AIC는 데이터의 가장 큰 변화를 설명하는 모델을 찾는 동시에 과도한 수의 매개변수를 사용하는 모델에 페널티를 적용하도록 설계되었습니다.
여러 회귀 모델을 적용한 후에는 각 모델의 AIC 값을 비교할 수 있습니다. AIC가 낮을수록 적합한 모델입니다.
다음 예에서는 SAS의 다양한 회귀 모델에 대한 AIC를 계산하는 방법을 보여줍니다.
예: SAS에서 AIC를 계산하는 방법
학생들이 수업에서 달성할 시험 성적을 예측하기 위해 세 가지 다중 선형 회귀 모델을 적합화한다고 가정해 보겠습니다.
각 모델에서 사용할 예측 변수는 다음과 같습니다.
- 모델 1의 예측 변수: 연구에 소요된 시간
- 모델 2의 예측 변수: 과거 실기 시험
- 모델 3의 예측 변수: 공부에 소비한 시간 및 연습 시험에 응시한 시간
먼저 다음 코드를 사용하여 학생 20명에 대한 이 정보가 포함된 데이터세트를 만듭니다.
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 96 5 4 90 3 4 82 4 4 85 6 5 99 2 1 83 1 0 62 2 1 76 ; run ;
다음으로, proc reg를 사용하여 이러한 각 회귀 모델을 맞추고 Selection=adjrsq sse aic 문을 사용하여 각 모델의 AIC 값을 계산합니다.
/*fit multiple linear regression models and calculate AIC for each model*/ proc reg data =exam_data; model score = hours prep_exams / selection=adjrsq sse aic; run ;
결과에서 각 모델의 AIC 값을 볼 수 있습니다.
- 시간을 예측 변수로 사용하는 AIC: 68.4537
- 시간과 시험을 예측 변수로 사용하는 AIC: 69.9507
- 시험을 예측 변수로 사용하는 AIC: 91.4967
AIC 값이 가장 낮은 모델은 예측 변수로 시간만 포함하는 모델입니다.
따라서 우리는 다음 모델이 데이터에 가장 적합하다고 선언합니다.
점수 = β 0 + β 1 (공부한 시간)
이 모델을 가장 좋은 것으로 식별하면 이를 적합화하고 R 제곱 값과 베타 계수를 포함한 결과를 분석하여 공부한 시간과 학생 성적 사이의 정확한 관계를 결정할 수 있습니다. ‘최종 시험.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS에서 단순 선형 회귀를 수행하는 방법
SAS에서 다중 선형 회귀를 수행하는 방법
SAS에서 R 제곱을 계산하는 방법
SAS에서 RMSE를 계산하는 방법