Excel에서 혼동 행렬을 만드는 방법
로지스틱 회귀 는 응답 변수가 이진일 때 사용할 수 있는 회귀 유형입니다.
로지스틱 회귀 모델의 품질을 평가하는 일반적인 방법은 모델의 예측 값과 테스트 데이터 세트의 실제 값을 보여주는 2×2 테이블인 혼동 행렬을 만드는 것입니다.
다음 단계별 예에서는 Excel에서 혼동 행렬을 만드는 방법을 보여줍니다.
1단계: 데이터 입력
먼저 로지스틱 회귀 모델에서 예측한 값과 함께 응답 변수의 실제 값 열을 입력해 보겠습니다.
2단계: 혼동 행렬 만들기
다음으로 COUNTIFS() 수식을 사용하여 Actual 열에서 “0”이고 Predicted 열에서도 “0”인 값의 개수를 계산합니다.
유사한 공식을 사용하여 혼동 행렬의 다른 모든 셀을 채울 것입니다.
3단계: 정확도, 정밀도 및 재현율 계산
혼동 행렬을 만든 후에는 다음 측정항목을 계산할 수 있습니다.
- 정확도 : 정확한 예측의 비율
- 정확도 : 전체 긍정적 예측에 비해 긍정적 예측을 수정합니다.
- 알림 : 전체 실제 긍정에 대한 긍정적 예측 수정
다음 수식은 Excel에서 이러한 각 측정값을 계산하는 방법을 보여줍니다.
정밀도가 높을수록 모델이 관측치를 더 정확하게 분류할 수 있습니다.
이 예에서 모델의 정확도는 0.7 로 관측치의 70%를 올바르게 분류했음을 나타냅니다.
원할 경우 이 정확도를 다른 로지스틱 회귀 모델의 정확도와 비교하여 관측치를 0 또는 1의 범주로 분류하는 데 가장 적합한 모델을 결정할 수 있습니다.