Spss에서 roc 곡선을 만들고 해석하는 방법


로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용하는 통계 방법입니다. 로지스틱 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 평가하기 위해 다음 두 가지 측정항목을 살펴볼 수 있습니다.

  • 민감도: 결과가 실제로 긍정적일 때 모델이 관찰에 대한 긍정적인 결과를 예측할 확률입니다.
  • 특이성: 결과가 실제로 부정적일 때 모델이 관찰에 대해 부정적인 결과를 예측할 확률입니다.

이 두 측정항목을 시각화하는 간단한 방법은 로지스틱 회귀 모델의 민감도와 특이성을 표시하는 그래프인 ROC 곡선을 만드는 것입니다.

이 튜토리얼에서는 SPSS에서 ROC 곡선을 생성하고 해석하는 방법을 설명합니다.

예: SPSS의 ROC 곡선

농구 선수가 NBA에 드래프트되었는지 여부(0 = 아니요, 1 = 예)와 대학에서의 경기당 평균 점수를 보여주는 다음 데이터 세트가 있다고 가정해 보겠습니다.

이 데이터세트에 대한 ROC 곡선을 만들려면 분석 탭, 분류 , ROC 곡선을 차례로 클릭합니다.

나타나는 새 창에서 초안 변수를 상태 변수라고 표시된 영역으로 드래그합니다. 상태 변수의 값을 1 로 설정합니다. (선수가 드래프트되었음을 나타내는 값입니다.) 변수 포인트를 테스트 변수라고 표시된 영역으로 드래그합니다.

대각선 참조선ROC 곡선 점 좌표 사용 옆의 확인란을 선택합니다. 그런 다음 확인을 클릭합니다.

결과를 해석하는 방법은 다음과 같습니다.

파일 처리 요약:

이 표에는 데이터 세트의 총 긍정적 및 부정적 사례 수가 표시됩니다. 이 예에서는 8명의 선수가 드래프트되었고(긍정적인 결과) 6명의 선수가 드래프트되지 않았습니다(부정적인 결과).

SPSS에서 ROC 곡선 해석

ROC 곡선:

ROC(수신기 작동 특성) 곡선은 임계값이 0에서 1로 변경됨에 따라 민감도 값과 특이도 1의 플롯입니다.

SPSS의 ROC 곡선

민감도와 특이도가 높은 모델은 플롯의 왼쪽 상단 모서리에 맞는 ROC 곡선을 갖습니다. 민감도와 특이도가 낮은 모델은 대각선 45도에 가까운 곡선을 갖습니다.

이 예에서 ROC 곡선(파란색 선)이 플롯의 왼쪽 상단 모서리를 감싸는 것을 볼 수 있습니다. 이는 모델이 게임당 평균 점수를 기반으로 플레이어가 드래프트될지 여부를 예측하는 데 효과적임을 나타냅니다. . .

곡선 아래 면적:

곡선 아래 영역은 긍정적인 결과와 부정적인 결과를 구별하는 모델의 능력에 대한 아이디어를 제공합니다. AUC의 범위는 0에서 1까지입니다. AUC가 높을수록 모델이 결과를 올바르게 분류하는 능력이 더 좋습니다.

SPSS의 ROC 곡선에 대한 AUC

이 특정 로지스틱 회귀 모델의 AUC는 0.948 로 매우 높은 것을 볼 수 있습니다. 이는 모델이 선수의 드래프트 여부를 잘 예측하고 있음을 나타냅니다.

곡선의 좌표:

이 마지막 표는 다양한 임계값에 대한 ROC 곡선의 민감도와 특이도 1을 표시합니다.

SPSS의 로지스틱 회귀 분석에서 곡선 좌표 해석

예를 들어:

임계값을 8.50 으로 허용하면 이는 게임당 8.50점 미만을 득점한 플레이어는 드래프트되지 않고 게임당 8.50점을 초과하는 플레이어는 드래프트될 것으로 예상한다는 의미입니다.

이를 임계값으로 사용하면 민감도는 100%(게임당 8.50점 미만을 득점한 모든 플레이어는 실제로 드래프트되지 않았기 때문에)가 되고 특이도 1은 66.7% (8.50점 이상을 득점한 플레이어 12명 중 8명이기 때문에)가 됩니다. 게임별로 드래프트되었습니다).

위의 표를 통해 각 잠재적 임계값에 대한 민감도와 특이도 1을 확인할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다