조정된 승산비: 정의 + 예


통계에서 승산비는 치료 그룹에서 사건이 발생할 확률과 통제 그룹에서 사건이 발생할 확률 간의 비율을 나타냅니다.

승산비는 하나 이상의 예측 변수와 이진 반응 변수가 있는 회귀 모델을 맞추는 데 사용하는 방법인 로지스틱 회귀에서 가장 일반적으로 나타납니다.

수정된 승산비는 모델의 다른 예측 변수에 대해 조정된 승산비입니다.

이는 다른 예측 변수의 효과를 조정한 예측 변수가 사건 발생 확률에 어떻게 영향을 미치는지 이해하는 데 특히 유용합니다.

다음 예에서는 승산비와 조정된 승산비의 차이를 보여줍니다.

예: 조정 승산비 계산

산모의 나이가 저체중아 출산 가능성에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.

이를 탐색하기 위해 연령을 예측 변수로 사용하고 저체중 출생(예 또는 아니오)을 응답 변수 로 사용하여 로지스틱 회귀를 수행할 수 있습니다.

300명의 엄마에 대한 데이터를 수집하고 로지스틱 회귀 모델을 적합하다고 가정합니다. 결과는 다음과 같습니다.

연령에 대한 승산비를 얻으려면 표에서 계수 추정값을 지수화하면 됩니다(e 0.173 = 1.189 ) .

이는 연령이 1년 증가하면 저체중아 출산 확률이 1,189 배 증가한다는 것을 의미합니다. 즉, 연령이 1년 더 증가할 때마다 저체중아 출산 확률은 18.9% 씩 증가한다.

이 승산비는 모델의 유일한 예측 변수이기 때문에 모델의 다른 예측 변수에 대해 조정되지 않았기 때문에 “조” 승산비 또는 “조정되지 않은” 승산비라고 합니다.

그러나 산모의 나이 흡연 습관이 저체중아 출산 가능성에 영향을 미치는지 알고 싶다고 가정해 보겠습니다.

이를 탐색하기 위해 연령과 흡연(예 또는 아니오)을 예측 변수로 사용하고 저출생 체중을 응답 변수 로 사용하여 로지스틱 회귀 분석을 수행할 수 있습니다.

300명의 엄마에 대한 데이터를 수집하고 로지스틱 회귀 모델을 적합하다고 가정합니다. 결과는 다음과 같습니다.

조정된 승산비의 예

결과를 해석하는 방법은 다음과 같습니다.

연령: 연령 조정 승산비는 다음과 같이 계산됩니다: e 0.045 = 1.046 . 이는 흡연 변수가 일정하다고 가정할 때, 연간 연령이 추가로 증가할 때마다 저체중아를 출산할 확률이 4.6% 증가한다는 의미입니다.

예를 들어 어머니 A와 어머니 B가 모두 담배를 피우고 있다고 가정해 보겠습니다. 엄마 A가 엄마 B보다 한 살 더 많다면, 엄마 A가 저체중아를 낳을 확률은 엄마 B가 저체중아를 낳을 확률의 1.046배이다.

흡연 : 흡연에 대한 조정 승산비는 다음과 같이 계산됩니다: e.485 = 1.624 . 이는 연령 변수가 일정하다고 가정할 때 산모가 흡연을 하면(비흡연에 비해) 저체중아 출산 확률이 62.4% 증가한다는 의미다.

예를 들어 어머니 A와 어머니 B가 모두 30세라고 가정해 보겠습니다. 엄마 A가 임신 중에 담배를 피우고 엄마 B는 담배를 피우지 않는다면 엄마 A가 저체중아를 출산할 확률은 엄마 B가 저체중아를 출산할 확률보다 62.4% 더 높다.

연령 조정 승산비는 이전 예의 조정되지 않은 승산비보다 낮습니다. 이는 다른 예측 변수가 반응 변수가 발생할 확률을 높이면 모델에 이미 존재하는 예측 변수에 대한 조정 승산비가 항상 감소하기 때문입니다.

요약: 승산비와 조정된 승산비 비교

승산비 (때때로 “조잡한” 승산비라고도 함)는 예측 변수의 변화가 반응 변수가 발생할 가능성에 어떻게 영향을 미치는지 알려주는 데 유용합니다.

조정된 승산비는 모델의 다른 예측 변수를 제어한 예측 변수의 변화가 반응 변수가 발생할 가능성에 어떻게 영향을 미치는지 알려주는 데 유용합니다.

추가 리소스

로지스틱 회귀 소개
R에서 로지스틱 회귀를 수행하는 방법
Python에서 로지스틱 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다