세 번째 변수 문제: 정의 및 예


통계에서 세 번째 변수 문제는 두 변수 사이에서 관찰된 상관관계가 실제로 고려되지 않은 세 번째 변수에 의해 설명될 수 있을 때 발생합니다.

이 세 번째 변수를 고려하지 않으면 연구된 두 변수 간의 상관관계가 오해를 불러일으키거나 심지어 혼란을 초래할 수도 있습니다.

이 튜토리얼에서는 다양한 맥락에서 세 번째 변수 문제의 몇 가지 예를 제공합니다.

예시 1: 개와 소화전

한 연구원은 소화전이 많은 도시일수록 개도 더 많은 경향이 있다는 사실을 관찰했습니다.

그러나 이 두 변수는 모두 세 번째 변수인 인구 규모와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.

대도시에는 소화전 개가 더 많은 경향이 있습니다. 반대로, 작은 마을에는 소화전 개가 적은 경향이 있습니다.

세 번째 변수 문제의 예

예시 2: 아이스크림 판매 및 상어 공격

연구원은 아이스크림 판매와 상어 공격이 강한 양의 상관관계가 있다는 사실을 발견했습니다.

그러나 이 두 변수는 모두 세 번째 변수인 온도 와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.

날씨가 따뜻해지면 더 많은 사람들이 아이스크림을 사고, 더 많은 사람들이 바다에서 수영을 합니다. 이는 아이스크림 판매와 상어 공격의 가치가 연중 같은 시기에 증가하는 경향이 있는 이유를 설명합니다.

세 번째 변수 문제

사례 3: 자원봉사자와 자연재해

자연재해 발생 시 자원봉사자가 많아질수록 피해가 커진다는 연구 결과가 나왔다.

그러나 이 두 변수는 모두 세 번째 변수인 자연 재해의 규모 와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.

자연재해가 클수록 피해가 늘어나고 자원봉사자 수가 늘어나는 것과 밀접한 상관관계가 있습니다.

현실 세계의 제3의 변수 문제의 예

관련 기사

생략변수 편향이란 무엇입니까?
과소계산 편향이란 무엇입니까?
집계 편향이란 무엇입니까?
혼란스러운 변수는 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다