세 번째 변수 문제: 정의 및 예
통계에서 세 번째 변수 문제는 두 변수 사이에서 관찰된 상관관계가 실제로 고려되지 않은 세 번째 변수에 의해 설명될 수 있을 때 발생합니다.
이 세 번째 변수를 고려하지 않으면 연구된 두 변수 간의 상관관계가 오해를 불러일으키거나 심지어 혼란을 초래할 수도 있습니다.
이 튜토리얼에서는 다양한 맥락에서 세 번째 변수 문제의 몇 가지 예를 제공합니다.
예시 1: 개와 소화전
한 연구원은 소화전이 많은 도시일수록 개도 더 많은 경향이 있다는 사실을 관찰했습니다.
그러나 이 두 변수는 모두 세 번째 변수인 인구 규모와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.
대도시에는 소화전 과 개가 더 많은 경향이 있습니다. 반대로, 작은 마을에는 소화전 과 개가 적은 경향이 있습니다.
예시 2: 아이스크림 판매 및 상어 공격
연구원은 아이스크림 판매와 상어 공격이 강한 양의 상관관계가 있다는 사실을 발견했습니다.
그러나 이 두 변수는 모두 세 번째 변수인 온도 와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.
날씨가 따뜻해지면 더 많은 사람들이 아이스크림을 사고, 더 많은 사람들이 바다에서 수영을 합니다. 이는 아이스크림 판매와 상어 공격의 가치가 연중 같은 시기에 증가하는 경향이 있는 이유를 설명합니다.
사례 3: 자원봉사자와 자연재해
자연재해 발생 시 자원봉사자가 많아질수록 피해가 커진다는 연구 결과가 나왔다.
그러나 이 두 변수는 모두 세 번째 변수인 자연 재해의 규모 와 강한 상관관계를 갖고 있기 때문에 상관관계가 있을 뿐입니다.
자연재해가 클수록 피해가 늘어나고 자원봉사자 수가 늘어나는 것과 밀접한 상관관계가 있습니다.
관련 기사
생략변수 편향이란 무엇입니까?
과소계산 편향이란 무엇입니까?
집계 편향이란 무엇입니까?
혼란스러운 변수는 무엇입니까?