Excel에서 혼동 행렬을 만드는 방법


로지스틱 회귀 는 응답 변수가 이진일 때 사용할 수 있는 회귀 유형입니다.

로지스틱 회귀 모델의 품질을 평가하는 일반적인 방법은 모델의 예측 값과 테스트 데이터 세트의 실제 값을 보여주는 2×2 테이블인 혼동 행렬을 만드는 것입니다.

다음 단계별 예에서는 Excel에서 혼동 행렬을 만드는 방법을 보여줍니다.

1단계: 데이터 입력

먼저 로지스틱 회귀 모델에서 예측한 값과 함께 응답 변수의 실제 값 열을 입력해 보겠습니다.

2단계: 혼동 행렬 만들기

다음으로 COUNTIFS() 수식을 사용하여 Actual 열에서 “0”이고 Predicted 열에서도 “0”인 값의 개수를 계산합니다.

유사한 공식을 사용하여 혼동 행렬의 다른 모든 셀을 채울 것입니다.

Excel의 혼동 행렬

3단계: 정확도, 정밀도 및 재현율 계산

혼동 행렬을 만든 후에는 다음 측정항목을 계산할 수 있습니다.

  • 정확도 : 정확한 예측의 비율
  • 정확도 : 전체 긍정적 예측에 비해 긍정적 예측을 수정합니다.
  • 알림 : 전체 실제 긍정에 대한 긍정적 예측 수정

다음 수식은 Excel에서 이러한 각 측정값을 계산하는 방법을 보여줍니다.

정밀도가 높을수록 모델이 관측치를 더 정확하게 분류할 수 있습니다.

이 예에서 모델의 정확도는 0.7 로 관측치의 70%를 올바르게 분류했음을 나타냅니다.

원할 경우 이 정확도를 다른 로지스틱 회귀 모델의 정확도와 비교하여 관측치를 0 또는 1의 범주로 분류하는 데 가장 적합한 모델을 결정할 수 있습니다.

추가 리소스

로지스틱 회귀 소개
로지스틱 회귀의 세 가지 유형
로지스틱 회귀와 선형 회귀

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다