좋은 aic 값은 무엇입니까?
AIC(Akaike Information Criterion)는 다양한 회귀 모델의 적합성을 비교하는 데 사용되는 측정항목입니다.
다음과 같이 계산됩니다.
AIC = 2K – 2ln (L)
금:
- K: 모델 매개변수의 수입니다.
- ln (L) : 모델의 로그 우도입니다. 이는 주어진 데이터에서 모델이 얼마나 가능성이 있는지 알려줍니다.
여러 회귀 모델을 적용한 후에는 각 모델의 AIC 값을 비교할 수 있습니다. AIC가 가장 낮은 모델이 가장 적합합니다.
AIC에 대해 학생들이 자주 묻는 질문은 다음과 같습니다. 좋은 AIC 값은 무엇입니까?
간단한 대답은 다음과 같습니다. 단순히 AIC를 회귀 모델을 비교하는 방법으로 사용하기 때문에 AIC에는 “좋음” 또는 “나쁨”으로 간주할 수 있는 가치가 없습니다. AIC가 가장 낮은 모델이 가장 적합합니다. AIC 값의 절대값은 중요하지 않습니다.
예를 들어 모델 1의 AIC 값이 730.5이고 모델 2의 AIC 값이 456.3인 경우 모델 2가 더 잘 맞습니다. AIC의 절대값은 중요하지 않습니다.
이 주제에 대한 유용한 참고 자료 는 심각한 통계: 행동 과학을 위한 고급 통계 가이드( 402페이지)에서 제공됩니다.
가능성과 마찬가지로 AIC의 절대값은 대체로 의미가 없습니다(임의의 상수에 의해 결정됨). 이 상수는 데이터에 따라 다르므로 AIC를 사용하여 동일한 샘플에 적합한 모델을 비교할 수 있습니다.
따라서 고려된 모든 그럴듯한 모델 중에서 가장 좋은 모델은 AIC 값이 가장 작은 것(실제 모델과 비교하여 정보 손실이 가장 적음)입니다.
매뉴얼에 명시된 바와 같이 AIC의 절대값은 중요하지 않습니다. 단순히 AIC 값을 이용하여 모델의 적합도를 비교하는데, AIC 값이 가장 낮은 모델이 가장 좋습니다.
모델이 데이터 세트에 잘 맞는지 확인하는 방법
AIC 값은 잠재적 모델 목록에서 데이터 세트에 가장 적합한 회귀 모델을 결정하는 데 유용한 방법이지만 실제로 모델이 데이터에 얼마나 잘 맞는지를 정량화하지는 않습니다.
예를 들어 특정 회귀 모델은 잠재적인 모델 목록 중에서 가장 낮은 AIC 값을 가질 수 있지만 여전히 적합하지 않은 모델일 수 있습니다.
모델이 데이터세트에 잘 맞는지 확인하기 위해 다음 두 가지 측정항목을 사용할 수 있습니다.
- Mallows’ Cp : 회귀 모델의 편향 정도를 정량화하는 측정항목입니다.
- 수정된 R-제곱 : 모델의 예측 변수로 설명할 수 있는 반응 변수의 분산 비율(모델의 예측 변수 수에 맞게 조정됨)
여러 잠재적 모델 중에서 “최상의” 회귀 모델을 선택하기 위한 잠재적 전략은 다음과 같습니다.
- 먼저 AIC 값이 가장 낮은 모델을 식별합니다.
- 그런 다음 이 회귀 모델을 데이터에 맞추고 Mallows Cp를 계산하고 모델의 R-제곱을 조정하여 실제로 데이터에 얼마나 잘 맞는지 정량화합니다.
이 접근 방식을 사용하면 가장 적합한 모델을 식별 하고 모델이 실제로 데이터에 얼마나 잘 맞는지 수량화할 수 있습니다.