전체 가이드: 로지스틱 회귀 결과를 보고하는 방법
로지스틱 회귀는 응답 변수가 이진일 때 사용하는 회귀 분석 유형입니다.
로지스틱 회귀 모델의 결과를 보고하기 위해 다음과 같은 일반 형식을 사용할 수 있습니다.
[예측변수 1], [예측변수 2],…[예측변수 n ] 및 [반응변수] 간의 관계를 분석하기 위해 로지스틱 회귀분석을 사용했습니다.
다른 모든 예측 변수를 일정하게 유지하면서 [반응 변수]가 발생할 확률은 [몇 퍼센트](95% CI [하한, 상한])만큼 [증가 또는 감소]되는 것으로 나타났습니다. [예측 변수 1].
다른 모든 예측 변수를 일정하게 유지하면서 [반응 변수]가 발생할 확률은 [몇 퍼센트](95% CI [하한, 상한])만큼 [증가 또는 감소]되는 것으로 나타났습니다. [예측 변수 2].
…
이 기본 구문을 사용하여 승산비와 모델의 각 예측 변수의 승산비에 대한 해당 95% 신뢰 구간을 보고할 수 있습니다.
다음 예에서는 실제로 로지스틱 회귀 모델의 결과를 보고하는 방법을 보여줍니다.
예: 로지스틱 회귀 결과 보고
교수가 두 가지 다른 학습 프로그램(프로그램 A와 프로그램 B)과 공부한 시간이 학생이 수업의 최종 시험에 합격할 확률에 영향을 미치는지 알고 싶어한다고 가정해 보겠습니다.
학습 시간과 학습 프로그램을 예측 변수로 사용하고 시험 결과(합격 또는 실패)를 응답 변수로 사용하는 로지스틱 회귀 모델에 적합합니다.
다음 출력은 로지스틱 회귀 모델의 결과를 보여줍니다.
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003
로지스틱 회귀 모델의 결과를 보고하기 전에 먼저 공식 e β 를 사용하여 각 예측 변수에 대한 승산비를 계산해야 합니다.
예를 들어, 각 예측 변수에 대한 승산비를 계산하는 방법은 다음과 같습니다.
- 프로그램 승산비: e 0.344 = 1.41
- 시간의 승산비: e 0.006 = 1.006
또한 공식 e (β +/- 1.96*표준 오차) 를 사용하여 각 예측 변수의 승산비에 대한 95% 신뢰 구간을 계산해야 합니다.
예를 들어, 각 예측 변수에 대한 승산비를 계산하는 방법은 다음과 같습니다.
- 프로그램 승산비에 대한 95% CI: e 0.344 +/- 1.96*0.156 = [1.04, 1.92]
- 시간 승산비에 대한 95% CI: e 0.006 +/- 1.96*0.002 = [1.002, 1.009]
이제 각 예측 변수에 대한 승산비와 해당 신뢰 구간을 계산했으므로 다음과 같이 모델 결과를 보고할 수 있습니다.
최종 시험 합격 확률에 대한 학습 시간과 교육 과정 간의 관계를 분석하기 위해 로지스틱 회귀 분석을 사용했습니다.
학습시간을 일정하게 유지하면 학습프로그램 A를 사용한 학생이 학습프로그램 B를 사용한 학생의 최종 시험 합격 확률이 41%(95% CI [0.04, 0.92]) 증가한 것으로 나타났습니다.
또한 학습 프로그램을 일정하게 유지하면 학습 시간이 추가될 때마다 최종 시험에 합격할 확률이 0.6%(95% CI [0.002, 0.009]) 증가하는 것으로 나타났습니다.
승산비가 해석하고 이해하기 더 쉽기 때문에 모델 베타 값과 달리 예측 변수에 대한 승산비를 보고했습니다.
추가 리소스
다음 자습서에서는 로지스틱 회귀에 대한 추가 정보를 제공합니다.
로지스틱 회귀 소개
R에서 로지스틱 회귀를 수행하는 방법
Python에서 로지스틱 회귀를 수행하는 방법
실생활에서 로지스틱 회귀를 활용한 4가지 예